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Nukleinsauremolekul, umfassend eine fur ein 
Hamocyanin kodierende Nukleinsauresequenz 



Die vorliegende Erfindung betrifft ein Nukleinsauremolekul, umfassend eine fur ein Ha- 
mocyanin, eine Hamocyanin-Domane Oder ein Fragment mit den immunologischen Ei- 
genschaften wenigstens einer Domane von Hamocyanin kodierende Nukleinsaurese- 
quenz, diese umfassende Konstrukte, die Nukleinsauresequenzen Oder die Konstrukte 
umfassende Wirtszellen, Verfahren zum Herstellen von Hamocyanin-Polypeptiden und 
rekombinante Hamocyanin-Polypeptide. 

Hamocyanin ist ein blaues Kupferprotein, das frei gelost im Blut zahlreicher Mollusken 
und Arthropoden auftritt und den Sauerstoff transportiert. Von den Mollusken enthalten 
die Cephalopoden, Chitonen, die meisten Gastropoden sowie einige Bivalvia Ha- 
mocyanin. Hamocyanin ist bei den Arthropoden typisch fur Arachniden, Xiphosuren, 
malakostrake Crustaceen und Scutigera. Zahlreiche Insektenarten weisen Proteine auf, 
die sich von Hamocyanin ableiten. Hamocyanine liegen extrazellular vor und flottieren in 
der Hamolymphe. 

Wahrend das Arthropoden-Hamocvanin bei elektronenmikroskopisnhgr I intprsnr.hnng 

einen Durchmesser von maximal 25 nm hat und eine Untereinheit ein Molekulargewicht 

#von 75.000 Da aufweist, sind Molluskencyanine viel grofler. So hat z.B. das Hamocya- 
nin von Megathura einen Durchmesser von 35 nm und ist aus 2 Untereinheiten zusam- 
mengesetzt. Jede Untereinheit hat ein Molekulargewicht von ca. 400.000 Da und ist in 
acht sauerstoffbindende Domanen aufgeteilt, die jeweils ein Molekulargewicht von ca. 
50.000 Da haben. Die Domanen unterscheiden sich immunologisch. Diese Domanen 
kdnnen durch limitierte Proteolyse aus der Untereinheit freigesetzt werden. 

Das im Elektronenmikroskop sichtbare Hamocyanin der Gastropoden hat ein Molekular- 
gewicht von ca. 8 Mio. Da und ist ein Di-Dekamer. Im Gegensatz hierzu ist das Ha- 
mocyanin der Cephalopoden als isoliertes Dekamer angeordnet, das sich auch in der 
Quartarstruktur deutlich vom Hamocyanin der Gastropoden unterscheidet. 
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Von besonderem immunologischen Interesse ist das Hamocyanin der kalifornischen 
Schlussellochschnecke Megathura crenulata, einer „Keyhole Limpet". Das Hamocyanin 
wird deshalb auch als Keyhole Limpet Hemocyanin (KLH) bezeichnet. Hamocyanine 
sind sehr starke Antigene. Die Immunisierung eines Vertebraten fuhrt zu einer bisher 
wenig verstandenen, unspezifischen Aktivierung des Immunsystems. Durch die allge- 
meine Aktivierung des Immunsystems ist es dann moglich, auch eine Immunreaktion 
gegenuber anderen, bisher tolerierten Fremdstrukturen zu erreichen. KLH wird vor allem 
als Hapten-Trager verwendet, urn so die Bildung von Antikorpern gegen das Hapten zu 
erreichen. 

| Neben Megathura crenulata gehort auch das Seeohr Haliotis tuberculata zur im Hinblick 
auf die Evolution relativ alten Gruppe der Archaegastropoda. Es ist bekannt, daft auch 
Haliotis Hamocyanin produziert. 

KLH ist ein Gemisch aus zwei unterschiedlichen Hamocyaninen, die als KLH1 und KLH2 
bezeichnet werden. Die Untereinheit des KLH1 ist ein 390 kDa Polypeptid, das aus acht 
globularen Domanen besteht, die entsprechend ihrer Reihenfolge in der Untereinheit mit 
1 a bis 1 h bezeichnet werden. KLH2 hingegen weist ein Molekulargewicht von 350 kDa 
auf und enthalt nach neuesten Daten ebenfalls 8 Domanen, die als 2 a bis 2 h bezeich- 
n et wenJen. In vivu ui l deljede A rt von Untereinneit Homo-uiigomere, wohingegen He- 
tero-Oligomere nicht beobachtet wurden. 

I Durch limitierte Proteolyse und gekreuzte Immunelektrophorese der Untereinheit von 
KLH1 und KLH2 wurden amino-, interne und carboxy-terminale Domanen erhalten, de- 
ren amino-terminale Sequenz bestimmt wurde (Sohngen et al., Eur. J. Biochem. 248 
(1997), 602-614; Gebauer et al., Zoology 98(1994), 51-68). Die erhaltenen Sequenzen 
erlauben jedoch nicht den Entwurf sequenzspezifischer Primer und/oder Sonden, die fur 
eine Hybridisierung mit genomischer DNA Erfolg versprechen. Obwohl beide KLH- 
Typen seit 1991 bzw. 1994 bekannt sind, konnte daher bisher keine Primarstruktur auf- 
geklart werden. 
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Auf DNA-Ebene ist bisher in bezug auf Mollusken nur die cDNA-Sequenz der Ha- 
mocyanin-Untereinheit aus dem Cephalopoden Octopus dofleini bekannt (Miller et al., J. 
Mol. Biol. 278 (1998), 827-842). Octopus dofleini ist phylogenetisch von den Archae- 
gastropoden sehr weit entfernt. Eine Hamocyanin-Gensequenz aus Mollusken ist bisher 
uberhaupt nicht bekannt. 



Wie von Miller et al. supra, beschrieben, ist es sowohl schwierig, eine einzige funktionel- 
le Domane (Funktionelle Einheit = Domane; auch „funktionelle Domane" genannt) zu 
isolieren als auch Gewebe zu erhalten, das zur Aufreinigung von mRNA fur die cDNA- 
Sequenzierung geeignet ist. 

Bei der Analyse des Hamocyanins aus Megathura crenulata besteht eine weitere 
Schwierigkeit darin, dafJ die Versuchstiere ein Alter von 4 bis 8 Jahren erreicht haben 
mussen, um ihnen erstmals Hamolymphe entnehmen zu konnen. Nach Entnahme der 
Hamolymphe wird Hamocyanin bei diesen Tieren nicht nachproduziert. Bisher ist nicht 
bekannt, wie die Hamocyaninsynthese stimuliert werden konnte. Daruber hinaus ist die 
Zucht von Megathura aufcerst aufwendig, da hierfur spezielle Stromungsbecken erfor- 
derlich sind. 



Es ist daher eine Aufgabe der vornegenden trtindung, Mittel und Wege bereitzustellen, 
um Hamocyanin und/oder Domanen davon in ausreichender Menge und kostengunstig 

kproduzieren zu konnen. Dies umfa&t die weitere Aufgabe, ein Verfahren anzugeben, mit 

f dem dieses Hamocyanin hergestellt werden kann. 

Diese Aufgabe wird erfindungsgemaft gelost durch ein Nukleinsaure-Molekul, umfas- 
send eine fur ein Hamocyanin, eine Hamocyanin-Domane oder ein funktionelles Frag- 
ment davon mit den immunologischen Eigenschaften wenigstens einer Domane eines 
Hamocyanins kodierende Nukleinsauresequenz, wobei die Nukleinsauresequenz aus- 
gewahlt ist aus 



(a) der Gruppe der nachfolgend angegebenen DNA-Sequenzen bzw. der ihnen ent- 
sprechenden RNA-Sequenzen: 
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in SEQ ID N0:1 (HtH1 Domane a + Signalpeptid), 

SEQ ID NO:2 (HtH1 Domane b), 

SEQ ID NO:3 (HtH1 Domane c), 

SEQ ID NO:4 (HtH1 Domane d), 

SEQ ID NO:5 (HtH1 Domane e), 

SEQ ID NO:6 (HtH1 Domane f), 

SEQ ID NO:7 (HtH1 Domane g), 

SEQ ID NO: 8 (HtH1 Domane h), 

SEQ ID NO:9 (partielle HtH2 Domane b), 

SEQ ID NO: 10 (HtH2 Domane c), 

SEQ ID NO: 11 (HtH2 Domane d), 

SEQ ID NO:12 (HtH2 Domane e), 

SEQ ID NO:13 (HtH2 Domane f), 

SEQ ID NO:14 (HtH2 Domane g), 

SEQ ID NO: 15 (HtH2 Domane h), 

SEQ ID NO: 1 6 (partielle KLH 1 Domane b), 

SEQ ID NO:17 (KLH1 Domane c), 

SEQ ID NO:18 (KLH1 Domane d), 

GEQ ID NO: 19 (pd i' lie l lbi KLH I Dui l iane e), — 

SEQ ID NO:20 (KLH2 Domane b), 

SEQ ID NO:21 (KLH2 Domane c), 

SEQ ID NO:22 (partielle KLH2 Domane d), 

SEQ ID NO:23 (KLH2 Domane g), 

SEQ ID NO:24 (partielle KLH2 Domane h); 

Nukleinsauresequenzen, die mit dem Gegenstrang einer Nukleinsauresequenz 
nach (a) hybridisieren und fur ein Polypeptid kodieren, das die immunologischen Ei- 
genschaften wenigstens einer Domane eines Hamocyanins aufweist; 



Nukleinsauresequenzen, die aufgrund des genetischen Codes zu den unter (a) und 
(b) definierten DNA-Sequenzen degeneriert sind und fur ein Polypeptid kodieren, 
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das die immunologischen Eigenschaften wenigstens einer Domane eines Ha- 
mocyanins aufweist; 



(d) Nukleinsauresequenzen, die mit einer der unter (a) bis (c) angegebenen Nuklein- 
sauresequenzen hybridisieren und deren Gegenstrang fur ein Polypeptid kodiert, 
das die immunologischen Eigenschaften wenigstens einer Domane eines Ha- 
mocyanins aufweist; 



(e) Nukleinsauresequenzen, die wenigstens 60 % homolog zu einer der unter (a) ange- 
gebenen Nukleinsauresequenzen sind; 

Varianten der unter (a) bis (e) angegebenen Sequenzen, wobei die Varianten Addi- 
tionen, Deletionen, Insertionen Oder Inversionen aufweisen und fur ein Polypeptid 
kodieren, das die immunologischen Eigenschaften wenigstens einer Domane von 
Hamocyanin aufweist; und 



(g) Kombinationen mehrerer der unter (a) bis (f) angegebenen DNA-Sequenzen. 



Im nachfolgenden werden einige Begriffe nSher erlautert, urn klarzustellen, wie sie im 
Zuoammonhang dor vor l iegend e i i Aiii i iuhJuny veislaiiden weiden Pollen. 

• Der Begriff "Hamocyanin", so, wie er nachfolgend in der Beschreibung verwendet wird, 
umfaBt vollstandiges Hamocyanin, Hamocyanin-Domanen und/oder Fragmente, Ha- 
mocyanin-Mutanten und Fusionsproteine. In bezug auf die Fusionsproteine sind insbe- 
sondere solche umfalit, bei denen die Fusion Hamocyanin und Antigene umfaBt. 

Unter „Domanen" werden funktionelle Teilsequenzen der Hamocyanin-Untereinheiten 
verstanden, die beispielsweise durch limitierte Proteolyse voneinander abgetrennt wer- 
den konnen. Weiterhin konnen sie unterschiedliche immunologische Eigenschaften 
aufweisen. 
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Mit den „immunologischen Eigenschaften wenigstens einer Domane von Hamocyanin" 
ist die Eigenschaft eines Polypeptids gemeint, in gleicher Weise wie wenigstens eine 
Domane von Hamocyanin eine immunologische Antwort des Empfangers zu induzieren, 
der mit dem Polypeptid immunisiert wird. Unter Jmmunologischer Antwort" werden hier 
T- und/oder B-Zell-Antworten gegen Hamocyanin-Epitope verstanden, wie beispielswei- 
se eine Antikorperproduktion. Die immunologische Reaktion kann beispielsweise beob- 
achtet werden durch Immunisieren eines Saugers, wie z.B. einer Maus, einer Ratte oder 
eines Kaninchens mit dem entsprechenden Polypeptid und Vergleich der Immunantwort 
auf das zur Immunisierung verwendete Polypeptid mit der Immunantwort auf naturliche 
Hamocyanine. 

Der Begriff "Antigen" umfaftt erfindungsgemaB sowohl Haptene, als auch schwache und 
starke Antigene. Haptene sind dadurch charakterisiert, daft sie Substanzen niedriger 
Molekulmasse (kleiner als 4000 Da) sind, jedoch ohne Kopplung an ein Tragermolekul 
nicht in der Lage sind, eine immunologische Reaktion auszulosen. Schwache Antigene 
sind Substanzen, die selbst bereits eine immunologische Reaktion auslosen konnen, 
deren Potential, eine immunologische Reaktion auslosen zu konnen, durch Kopplung 
mit einem Trager-Molekul auf Protein- und/oder DNA-Ebene, noch erhoht werden kann. 



"His - Tag" b e deutot e in e S e qu e nz von wen i gste n s 0 H istid i n-Aniiiiusau i e i i, die du i ch 
entsprechende Klonierung und Fusion mit einer exprimierbaren Sequenz zu einem Fu- 

ksionsprotein mit wenigstens 6 His-Resten am NH 2 -Terminus fuhrt, das leicht durch 

'Komplexierung mit einer Ni 2+ -Saule aufgereinigt werden kann. 

"Klonierung" soli alle im Stand der Technik bekannten Klonierungsmethoden umfassen, 
die hier zum Einsatz kommen konnten, die jedoch nicht alle im einzelnen beschrieben 
werden, weil sie zum selbstverstandlichen Handwerkszeug des Fachmanns gehoren. 

„Varianten" einer Nukleinsaure umfassen Additionen, Deletionen, Insertionen oder In- 
versionen und kodieren fur ein Polypeptid, das die immunologischen Eigenschaften 
wenigstens einer Domane von Hamocyanin aufweist. Varianten konnen kunstlich oder 
naturlich sein. Ein Beispiel fur naturliche Varianten stellen allelische Varianten dar. 
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Unter "rekombinanter Expression in einer geeigneten Wirtszelle" sollen alle im Stand der 
Technik bekannten Expressionsmethoden in bekannten Expressionssystemen verstan- 
den werden, die hierzum Einsatz kommen kdnnten, jedoch nicht alle im einzelnen be- 
schrieben werden, weil sie zum selbstverstandlichen Handwerkszeug des Fachmanns 
gehoren. 

Die im erfindungsgemafcen Nukleinsauremolekul enthaltene Nukleinsauresequenz kann 
genomische DNA, cDNA Oder synthetische DNA sein, wobei unter synthetischen DNA- 
Sequenzen auch solche verstanden werden, die modifizierte Internukleosid-Bindungen 
enthalten. Weiter kann es sich bei den Nukleinsauresequenzen urn RNA-Sequenzen 
handeln, was z.B. fur die Expression mittels rekombinanter Vektorsysteme erforderlich 
sein kann. Die Nukleinsauresequenzen gemaiJ (b) sind beispielsweise erhaltlich durch 
Verwenden einer nachweisbar markierten Sonde, die einer der unter (a) angegebenen 
Sequenzen oder einem Fragment bzw. deren Gegenstrang entspricht, zum Screening 
von cDNA-/genomischen DNA-Bibliotheken aus Mollusken oder Arthropoden. Die der 
cDNA-Bibliothek zugrundeliegende mRNA ist vorzugsweise aus Mollusken-Geweben zu 
erhalten, die Hamocyanin besonders stark exprimieren, wie z.B. Mantel-Gewebe aus 
Gastropoden und Branchialdrusengewebe aus Cephalopoden. 



Die Identifizierung positiver cDNAVgenomischer DNA-Klone erfolgt gemaft Standardver- 

• fahren. Vgl. Maniatis et al., Molecular Cloning (1989) Cold Spring Harbor Laboratory 
Press. 

In einer bevorzugten Ausfuhrungsform wird die unter (b) oder (d) angegebene Hybridi- 
sierung unter stringenten Bedingungen durchgefuhrt. Stringente Hybridisierungsbedin- 
gungen sind z.B. 68°C uber Nacht in 0,5 x SSC; 1% Blockierungsreagenz (Boehringer 
Mannheim); 0,1 % Natriumlaurylsarcosinat und nachfolgendem Waschen mit2 x SSC; 
0,1 %SDS. 

In einer bevorzugten Ausfuhrungsform werden Nukleinsauresequenzen bereitgestellt, 
die wenigstens 60 % homolog zu einer der unter (a) angegebenen Nukleinsaurese- 



8 



quenzen sind. Bevorzugt sind die Nukleinsauresequenzen wenigstens 80 % homolog zu 
einer der unter (a) angegebenen Nukleinsauresequenzen. Besonders bevorzugt sind 
die Nukleinsauresequenzen wenigstens 90 % homolog zu einer der unter (a) angege- 
benen Nukleinsauresequenzen. Insbesondere sind die Nukleinsauresequenzen wenig- 
stens 95 % homolog zu einer der unter (a) angegebenen Nukleinsauresequenzen. 

Erfindungsgemafi bedeutet der Ausdruck „Homologie" Homologie auf DNA-Ebene, die 
gemafc bekannter Verfahren, z.B. der computergestutzten Sequenzvergleiche (Basic lo- 
cal alignment search tool, S.F. Altschul et al., J. Mol. Biol. 215 (1990), 403-410) be- 
stimmt werden kann. 

Der dem Fachmann bekannte Ausdruck „Homologie" bezeichnet den Grad der Verwandt- 
schaft zwischen zwei Oder mehr NukleinsSuremolekulen, der durch die Ubereinstimmung 
zwischen den Sequenzen bestimmt wird. Der Prozentsatz der „Homologie" ergibt sich aus 
dem Prozentsatz identischer Bereiche in zwei oder mehr Sequenzen unter Berucksichtigung 
von Lucken oder anderen Sequenzbesonderheiten. 

Die Homologie miteinander verwandter Nukleinsauremolekule kann mit Hilfe bekannter 
Verfahren bestimmt werden. In der Regel werden spezielle Computerprogramme mit den 
bosondoron Anfordorungon Rochnung tmgondon Algor i thmon oinge3ctzt. 

• Bevorzugte Verfahren zur Bestimmung der Homologie erzeugen zunachst die grdRte Uber- 
einstimmung zwischen den untersuchten Sequenzen. Computerprogramme zur Bestimmung 
der Homologie zwischen zwei Sequenzen umfassen, sind jedoch nicht eingeschrankt auf, 
das GCG Programmpaket, einschliefclich GAP (Devereux, J., et al., Nucleic Acids Research 
12 (12): 387 (1984); Genetics Computer Group University of Wisconsin, Madison, (Wl)); 
BLASTP, BLASTN und FASTA (Altschul, S. et al., J. Molec Biol 215:403/410 (1990)). Das 
BLAST X Programm kann vom National Centre for Biotechnology Information (NCBl) und 
aus weiteren Quellen bezogen werden (BLAST Handbuch, Altschul S., et al., NCB NLM NIH 
Bethesda MD 20894; Altschul, S., et al., J. Mol. 215:403/410 (1990)). Auch der bekannte 
Smith Waterman-Algorithmus kann zur Bestimmung von Homologien verwendet werden. 
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Bevorzugte Parameter fur den Nukleinsauresequenz-Vergleich umfassen die nachstehen- 
den: 

Algorithmus: Needleman und Wunsch, J. Mol. Biol 48:443-453 (1970) 

Vergleichsmatrix: Ubereinstimmung (matches) = + 10, 

Nichtubereinstimmung (mismatch) = 0 

Lucken-Wert (Gap Penalty): 50 

Luckenlangen-Wert: 

(Gap Length Penalty): 3 

^^P^ Das GAP-Programm ist auch zur Verwendung mit den vorstehenden Parametern geeignet. 

Die vorstehenden Parameter sind die Fehler-Parameter (default parameters) fur Nukleinsau- 
resequenz-Vergleiche. 

Weitere beispielhafte Algorithmen, Lucken-Offnungs-Werte (gap opening penalties), Luk- 
kenausdehnungs-Werte (gap extension penalties), Vergleichsmatrizen einschlieGlich der im 
Programm-Handbuch, Wisconsin-Paket, Version 9, September 1997, genannten konnen 
verwendet werden. Die Auswahl wird von dem durchzufuhrenden Vergleich abhangen und 

weiterhin davon, ob der Vergleich zwischen Sequenzpaaren, wobei GAP oder Best Fit be- 

vorzugt sind, oder zwischen einer Sequenz und einer umfangreichen Sequenz-Datenbank, 

^^^^ wobei FASTA oder BLAST bevorzugt sind, durchgefuhrtwird. 

Eine mit dem oben genannten Algorithmus ermittelte Ubereinstimmung von 60 % wird im 
Rahmen dieser Anmeldung als 60 % Homologie bezeichnet. Entsprechendes gilt fur hdhere 
Homologiegrade. 

In einer bevorzugten Ausfuhrungsform ist die erfindungsgemafte DNA-Sequenz eine 
Kombination mehrerer der unter (a) bis (f) angegebenen DNA-Sequenzen, die durch 
dem Fachmann bekannte Fusion und gegebenenfalls Klonierung erhalten werden kon- 
nen. Diese Kombination sind von besonderem Interesse, da sie besonders immunogen 
sind. Insbesondere sind Kombinationen bevorzugt, die mehrere oder alle Domanen in 
der in der Untereinheit naturlicherweise vorkommenden Reihenfolge (a bis h) aufweisen. 
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Besonders bevorzugt sind dabei Ausfuhrungsformen, in denen die fur die Domanen 
kodierenden Nukleinsauresequenzen direkt im Raster aneinandergekoppelt sind. 

Weiterhin werden Konstrukte bereitgestellt, die die erfindungsgemafien Nukleinsaure- 
molekule umfassen. In einer bevorzugten Ausfuhrungsform umfafJt das erfindungsge- 
malie Konstrukt einen zur Expression geeigneten Promoter, wobei die Nukleinsaurese- 
quenz unter der Kontrolle des Promotors steht. Die Wahl des Promotors hangt vom zur 
Expression verwendeten Expressionssystem ab. Generell sind konstitutive Promotoren 
bevorzugt, jedoch sind auch induzierbare Promotoren wie z.B. der Metallothionein- 
Promotor moglich. 

In einer weiterhin bevorzugten Ausfuhrungsform umfafct das Konstrukt ferner eine Anti- 
gen-kodierende Nukleinsauresequenz, die direkt mit der erfindungsgemaften Ha- 
mocyanin-Nukleinsaure verbunden ist. Die Antigen-kodierende Sequenz kann sowohl 
5' als auch 3' relativ zur Hamocyanin-Sequenz oder auch an beiden Enden gelegen 
sein. Sie schlieRt im gleichen Leseraster entweder unmittelbar an die Hamocyanin- 
Sequenz an oder ist durch einen Nukleinsaure-Linker unter Wahrung des Leserasters 
mit ihr verbunden. Durch die Fusion der Antigen-kodierenden Sequenz mit der Ha- 
mocyanin-Sequenz ist die Bildung eines Fusionsproteins beabsichtigt, in dem die Anti- 
gen-k od i erende Sequenz kuvd l mil m i t dm 1 H a i riucyaiiiii-S equenz verbunden 1st. Das er- 
findungsgemaGe Antigen ist hierbei ein medizinisch relevantes Antigen, das beispiels- 
k weise ausgewahlt ist aus: Tumorantigenen, Virusantigenen und Antigenen bakterieller 
"oder parasitarer Pathogene. Tumorantigene konnen hierbei beispielsweise Rb und p53 
sein. Vorzugsweise stammen die Virusantigene aus immunologisch relevanten Viren, 
wie z.B. Influenza-Virus, Hepatitis-Virus und HIV. Pathogenantigene sind unter anderem 
solche aus Saugerpathogenen, insbesondere humanpathogenen Organismen, wie z.B. 
Plasmodium. Bakterielle Antigene konnen z.B. von Klebsiella, Pseudomonas, E. coli, 
Vibrio cholerae, Chlamydia, Streptococcen oder Staphylococcen stammen. 



In einer weiteren bevorzugten Ausfuhrungsform umfalit das Konstrukt ferner wenigstens 
ein Teil eines Vektors, insbesondere regulatorische Regionen, wobei der Vektor ausge- 
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wahlt ist aus : Bacteriophage!! wie A,-Derivaten, Adenoviren, Vacciniaviren, Baculoviren, 
SV40-Viren und Retroviren, vorzugsweise MoMuLV (Moloney Murine Leukemia Virus). 

Ferner ist ein Konstrukt bevorzugt, das zusatzlich eine His-Tag-kodierende DNA- 
Sequenz umfafit, die bei Expression des Konstrukts zur Bildung eines Fusionsproteins 
mit einem His-Tag am NH 2 -Terminus des Hamocyanins fuhrt, welches die Aufreinigung 
des Proteins an einer Nickel-Saule durch Chelat-Bildung erleichtert. 

Ferner stellt die Erfindung Wirtszellen bereit, die das Konstrukt enthalten und die zur 
Expression des Konstruktes geeignet sind. Im Stand der Technik sind zahlreiche pro- 
karyontisch'e und eukaryontische Expressionssysteme bekannt, wobei die Wirtszellen 
beispielsweise ausgewahlt sind aus prokaryontischen Zellen wie E. coli Oder B. subtilis, 
aus eukaryontischen Zellen wie Hefezellen, Insektenzellen und Saugerzellen, z.B. CHO- 
Zellen, COS-Zellen Oder HeLa-Zellen, sowie Derivaten davon. Im Stand der Technik 
sind beispielsweise bestimmte CHO-Produktionslinien bekannt, deren Glykosylierungs- 
muster im Vergleich zu CHO-Zellen verandert sind. Die durch die Verwendung Glykosy- 
lierungs-defizienter Oder Glykosylierungs-verringerter Wirtszellen erhaltenen Hamocya- 
nine verfugen moglicherweise uber zusatzliche Epitope, die bei vollstandiger Glykosylie- 
rung ansonsten dem Immunsystem des EmpfSngers nicht zuganglich sind, so dais Ha- 

mucyan i ne mit ve rr lnge r ter G l ykosyl l e r ung unter umstanden eine erhohte i mmunoge- — 

nizitat aufweisen. 

^^^^Gegenstand der vorliegenden Erfindung istweiter ein Verfahren zum Herstellen eines 
Hamocyanin-Polypeptids. Dazu wird das erfindungsgemafle Nukleinsauremolekul 
und/oder das Konstrukt in einer geeigneten Wirtszelle exprimiert und das Protein aus 
der Wirtszelle oder dem Medium mittels ublicher Verfahren isoliert. 

Dem Fachmann sind zahlreiche Verfahren zur Expression von DNA-Sequenzen be- 
kannt; vergleiche Recombinant Gene Expression Protocols in Methods in Molecular 
Biology, Band 62, Humana Press Totowa New Jersey (1995). Die Expression kann so- 
wohl konstitutiv als auch induzierbar sein, wobei Induktoren wie beispielsweise IPTG und 
Zn 2+ dem Fachmann bekannt sind. Das hergestellte Hamocyanins kann, falls ein His- 
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Tag an den NH 2 -Terminus des Hamocyanin fusioniert wurde, durch Chelat-Bildung an 
einer Nickel-Saule aufgereinigt werden. Verfahren zum Aufreinigen von Hamocyanin, 
insbesondere KLH, finden sich in Harris et al., Micron 26 (1995), 201-212. Vorzugsweise 
wird das Hamocyanin durch lonenaustausch-Chromatographie und/oder Gelfiltrations- 
chromatographie aufgereinigt. Die Durchfuhrung dieser Mafinahmen ist dem Fachmann 
bekannt. 

In einer weiteren bevorzugten Ausfuhrungsform wird das erfindungsgemafJ hergestellte 
Hamocyanin modifiziert. Die Modifikationen umfassen hierbei die Di-, Oligo- und Poly- 

• merisierung des monomeren Ausgangsprodukts beispielsweise durch Quervernetzung, 
z.B. durch Dicyclohexylcarbodiimid Oder Pegylierung Oder Assoziation (self assembly). 
Die somit hergestellten Di-, Oligo- und Polymere konnen voneinander durch Gelfiltration 
abgetrennt werden. Insbesondere beabsichtigt ist die Bildung von Dekameren, Dideka- 
meren Oder Multi-Dekameren. Weitere Modifikationen umfassen Seitenketten- 
Modifikationen, beispielsweise von s-Amino-Lysin-Resten des Hamocyanins, Oder Ami- 
no- bzw. Carboxy-terminale Modifikationen. Besonders bevorzugt ist die Modifikation 
des Hamocyanins durch kovalente Bindung an ein Antigen, wobei das Antigen stochio- 
metrisch Oder nicht-stochiometrisch mit dem Hamocyanin umgesetzt sein kann. Das An- 
tigen ist vorzugsweise ausgewahlt aus Tumorantigenen, Virusantigenen und Pathoge- 

nenantigenen wie oben ausgetuhrt. Weitere MoaitiKationen umtassen posttranslationale 

Ereignisse, z.B. die Glykosylierung oder die partielle oder vollstandige Deglykosylierung 

In einer bevorzugten Ausfuhrungsform ist das erhaltene Hamocyanin bei rekombinanter 
Expression in Prokaryonten oder Glykosylierungs-defizienten Eukaryonten nicht- 
glykosyliert. Ebenfalls in Betracht gezogen wird erfindungsgemaft Hamocyanin, das 
durch rekombinante Expression in zur Glykosylierung fahigen Eukaryonten wie Hefezel- 
len, Insektenzellen oder Saugerzellen, wie CHO-Zellen oder HeLa-Zellen, glykosyliert 
ist. 



In einer weiteren Ausfuhrungsform werden Hamocyanin-Polypeptide zur Verfugung ge- 
stellt, die eine Aminosauresequenz umfassen, wobei die Aminosauresequenz von einer 
oder mehreren der erfindungsgemaRen Nukleinsauremolekule kodiert wird. 

Bevorzugt werden Hamocyanin-Polypeptide zur Verfugung gestellt, die wenigstens eine 
aus der folgenden Gruppe ausgewahlte Aminosauresequenz umfassen: 

SEQ ID NO:25 (HtH1 Domane a + Signalpeptid), 
SEQ ID NO:26 (HtH1 Domane b), 

• SEQ ID NO:27 (HtH1 Domane c), 
SEQ ID NO:28 (HtH1 Domane d), 
SEQ ID NO:29 (HtM Domane e), 
SEQ ID NO:30 (HtH1 Domane f), 
SEQ ID NO:31 (HtH1 Domane g), 
SEQ ID NO:32 (HtH1 Domane h), 
SEQ ID NO:33 (partielle HtH2 Domane b), 
SEQ ID NO:34 (HtH2 Domane c), 
SEQ ID NO:35 (HtH2 Domane d), 
SEQ ID NO:36 (HtH2 Domane e), 

GEQ I D NO:37 (I HI 1 2 D o mane f), - 

SEQ ID NO:38 (HtH2 Domane g), 

• SEQ ID NO:39 (HtH2 Domane h), 
SEQ ID NO:40 (partielle KLH1 Domane b), 
SEQ ID NO:41 (KLH1 Domane c), 
SEQ ID NO:42 (partielle KLH1 Domane d), 
SEQ ID NO:43 (partielle KLH1 Domane e), 
SEQ ID NO:44 (KLH2 Domane b), 
SEQ ID NO:45 (KLH2 Domane c), 
SEQ ID NO:46 (partielle KLH2 Domane d), 
SEQ ID NO:47 (KLH2 Domane g), 
SEQ ID NO:48 (partielle KLH2 Domane h), 
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oder ein Fragment einer dieser Sequenzen, das die immunologischen Eigenschaften 
wenigstens einer Domane von Hamocyanin aufweist. 

In einer weiteren Ausfuhrungsform stellt die Erfindung Hamocyanin-Polypeptide, erhalt- 
lich durch das rekombinante Herstellungsverfahren oder Modifikationen davon, bereit. 

Bevorzugt sind Hamocyanin-Polypeptide, die jede der Sequenzen SEQ ID NO: 25 bis 
32 umfassen, und Hamocyanin-Polypeptide, die die Sequenzen SEQ ID NO: 33 bis 39 
umfassen. Besonders bevorzugt handelt es sich bei diesen Hamocyanin-Polypeptiden 
urn Hamocyanin 1 oder 2 aus Haliotis tuberculata . 

Insbesondere bevorzugt ist Hamocyanin 1 aus Haliotis tuberculata, das ein scheinbares 
Molekulargewicht von 370 kDa in SDS-PAGE unter reduzierenden Bedingungen auf- 
weist. Weiterhin ist insbesondere Hamocyanin 2 aus Haliotis tuberculata bevorzugt, das 
ein scheinbares Molekulargewicht von 370 kDa in SDS-PAGE PAGE unter reduzieren- 
den Bedingungen aufweist. Die Hamocyanine sind durch das in den Beispielen be- 
schriebene selektive Dissoziationsverfahren aus Gesamt-Hamocyanin aus Haliotis tu- 
berculata erhaltlich. 



W ei t e r hi n b evo r zu g t s i nd I l amocyan i n- Pol ypept i de, d i e j e de der Seque n z en SEQ I D 

_ NO: 40 bis 43 umfassen, und Hamocyanin-Polypeptide, die jede der Sequenzen SEQ ID 
^|^NO: 44 bis 48 umfassen. 

Besonders bevorzugt handelt es sich bei diesen Hamocyanin-Polypeptiden urn voll- 
standiges Hamocyanin 1 (KLH1) oder 2 (KLH2) aus Mepathura crenulata . 

Weiterhin wird nicht-glykosyliertes und glykosyliertes Hamocyanin-Polypeptid, erhaltlich 
durch Expression in zur Glykosylierung fahigen bzw. unfahigen Wirtszellen, bereitge- 
stellt. Je nach vorgesehener Verwendung des Hamocyanin-Polypeptids kann das Gly- 
kosylierungsmuster von Hefe, inbesondere methylotropher Hefe, von COS- oder HeLa- 
Zellen bevorzugt sein. 
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Die Erfindung betrifft weiterhin pharmazeutische Zusammensetzungen, die die erfin- 
dungsgemaften Nukleinsauremolekule und physiologisch vertragliche Zusatzstoffe, die 
im Stand der Technik bekannt sind, enthalten. Vorzugsweise werden die pharmazeuti- 
schen Zusammensetzungen zur unspezifischen Immunstimulierung in Form einer 
Gentherapie eingesetzt, wobei nach Transformation mit einem geeigneten Vektor Ha- 
mocyanin-Polypeptide exprimiert werden und zur Antigenisierung des Gewebes dienen. 

Insbesondere sieht die vorliegende Erfindung die Verwendung eines erfindungsgema- 
(Sen Nukleinsauremolekuls, das mit einer Antigen-kodierenden DNA-Sequenz verbun- 

•den ist, zur spezifischen Immunisierung gegen dieses Antigen vor. Die Immunisierung 
beruht hierbei, ohne an diese Theorie gebunden zu sein, auf der unspezifischen Stim- 
mulierung des Immunsystems durch Hamocyanin-Polypeptid-Epitope und die weiterge- 
hende spezifische Immunisierung durch Erkennung von Antigen-Epitopen durch das 
Immunsystem. 

Eine solche Immunisierung ist besonders wertvoll im Hinblick auf Pathogen-Antigene, 
ganz besonders aber im Hinblick auf Tumorantigene. Die Anwendbarkeit der erfin- 
dungsgemafcen pharmazeutischen Zusammensetzung zur Behandlung von Tumorer- 
krankungen ergibt sich auch aus der Kreuzreaktivitat der gebildeten Hamocyanin- 

s p e zifisch e n Antikorp e r mit Kohlonhydratroston, dio auf dor Oborflacho von Tumoron — 

auftreten, wie z.B. dem Thomsen-Friedenreich-Antigen, das bei der Mehrzahl von hu- 

• manen Tumoren wie Epithelialkarzinomen, Ovarialkarzinom, Kolonrektalkarzinom, 
Mammakarzinom, Bronchialkarzinom und Harnblasenkarzinom auftritt. 

Weiterhin konnen die erfindungsgemafcen pharmazeutischen Zusammensetzungen 
zum Behandeln von parasitaren Erkrankungen wie Schistosomiasis und fur die Kokain- 
MiBbrauchsvorsorge eingesetzt werden. 

Als weitere Ausfuhrungsform der vorliegenden Erfindung werden pharmazeutische Zu- 
sammensetzungen zur Verfugung gestellt, die ein erfindungsgemaftes Hamocyanin- 
Polypeptid in Verbindung mit einem Oder mehreren physiologisch vertraglichen Zu- 
satzmitteln enthalten. Wie oben bereits erwahnt, kann ein solches Hamocyanin-Poly- 
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peptid aus einer vollst^ndigen Hamocyanin-Untereinheit, aus einer Oder mehreren Do- 
manen sowie aus einem oder mehreren Fragmenten solcher Domanen bestehen, vor- 
ausgesetzt, dafc diese Fragmente noch die immunologischen Eigenschaften wenigstens 
einer Domane eines Hamocyanins aufweist. Eine solche pharmazeutische Zusammen- 
setzung eignet sich durch die entweder unspezifische Immunstimulation, die allein auf 
das Hamocyanin zuruckzufuhren ist, oder durch die spezifische Immunreaktion auf mit 
dem Hamocyanin assoziierte Antigene z.B. als Antiparasitenmittel, Antivirusmittel oder 
Antitumormittel. So kann sie z.B. zum Behandeln von Schistosomiasis, Epithelialkarzi- 
nomen, Ovarialkarzinom, Kolonrektalkarzinom, Mammakarzinom, Bronchialkarzinom 

• und Harnblasenkarzinomen eingesetzt werden, eignet sich jedoch auch zum Behandeln 
von Bluthochdruck. Die Behandlung von Bluthochdruck wird erreicht, indem eine Immu- 
nisierung mit Hilfe von erfindungsgemaSen Hamocyanin-p-adrenergen-Rezeptorpeptid- 
Konstrukten und/oder Fusionsproteinen durchgefuhrt wird. 

In einer weiteren Ausfuhrungsform werden die erfindungsgemaften pharmazeutischen 
Zusammensetzungen als Impfstoffe verwendet. Sie konnen somit einen wertvollen Bei- 
trag zur Prophylaxe von durch bekannte Pathogene verursachte Erkrankungen leisten. 
Dies gilt insbesondere fur pharmazeutische Zusammensetzungen, in denen ein Ha- 
mocyanin-Polypeptid an ein Virus, Virusbestandteil, abgetotete Bakterien, Bakterienbe- 

standto i lQ, i nsbosondoro Oborflachonprotoino auo Viruo odor B aktor i onhu l lon, DMA, 

DNA-Bestandteile, anorganische oder organische Molekule, z.B. Kohlenhydrate, Pepti- 
de und/oder Glykoproteine gebunden ist. 

GemaG einer weiteren bevorzugten Ausfuhrungsform wird die erfindungsgemalle phar- 
mazeutische Zusammensetzung zur Kokain-MiGbrauchsvorsorge verwendet. 

Zur Applikation sowohl der erfindungsgemafJen Nukleinsauremolekule als auch der 
Hamocyanin-Polypeptide eignen sich insbesondere Liposomen. Dementsprechend 
umfaBt die vorliegende Erfindung Liposomen, die ein erfindungsgemaGes Nukleinsau- 
remolekul, ein erfindungsgemaGes Konstrukt oder ein erfindungsgema&es Hamocyanin- 
Polypeptid umfassen. 
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Dem Fachmann sind verschiedene Verfahren zum Herstellen von Liposomen, die fur 
pharmazeutische Zwecke verwendbar sind, bekannt. Die Selektivitat der die erfindungs- 
gemaften Nukleinsauremolekule Oder Hamocyanin-Polypeptide enthaltenden Liposo- 
men kann durch den zusatzlichen Einbau von Zellerkennungsmolekulen in die Liposo- 
men erhoht werden, die selektiv an Zielzellen binden. Hierzu eignen sich insbesondere 
Rezeptorliganden, die an Rezeptoren der Zielzellen binden, Oder, besonders im Fall von 
Tumoren, Antikorper, die gegen Oberflachenantigene der jeweils anvisierten Zielzellen 
gerichtet sind. 

• Die erfindungsgemafcen Hamocyanin-Polypeptide sind auGerdem als Tragermolekul fur 
Arzneistoffe, wie z. B. Cytostatika, vorgesehen. Die Vergrolierung des Molekulargewich- 
tes veriangert die physiologische Halbwertszeit der Arzneistoffe erheblich, da der Verlust 
durch Ultrafiltration in der Niere deutlich verringert ist. 

Die Zubereitung der Impfstoffe erfolgt nach dem Fachmann bekannten Verfahren; in ei- 
nigen Ausfuhrungsformen ist die zusatzliche Verwendung von Adjuvanzien wie z. B. 
Freundsches Adjuvanz oder Polysacchariden vorgesehen. 

Die Erfindung stellt ferner Antikorper bereit, die spezifisch mit dem erfmdungsgemaflen 

Homocyanin - Polypoptid roagi e ren und e rhaltlich s i nd durch Immu n isieren eines Ve r - 

suchstieres mit einem Hamocyanin-Polypeptid. Polyklonale Antikorper konnen durch 

• Immunisieren beispielsweise von Kaninchen und anschliefcendem Gewinnen von Anti- 
seren erhalten werden. Monoklonale Antikorper konnen gemafJ Standardverfahren 
durch Immunisieren von z.B. Mausen, Gewinnen und Immortalisieren der Milzzellen und 
Klonieren der Hybridome, die fur Hamocyanin spezifische Antikorper produzieren, erhal- 
ten werden. 

Weiterhin wird ein Screening-Verfahren zum Identifizieren von Tumor-spezifischer DNA 
in einerZelle bereitgestellt, das die Schritte umfaBt: 
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a) das Inkontaktbringen zellularer DNA und/oder zellularen Proteins mit einer Sonde 
umfassend das erfindungsgemaSe Nukleinsauremolekul und/oder den erfindungs- 
gemaRen Antikorper und 



b) das Nachweisen der spezifischen Bindung. 



Vorzugsweise ist der nachzuweisende Tumor ein Harnblasenkarzinom, Epithelialkarzi- 
nom, Ovarialkarzinom, Mammakarzinom, Bronchialkarzinom Oder Kolonrektalkarzinom. 



•Es ist beabsichtigt, mit den nachfolgenden Figuren und Beispielen die Erfindung zu er- 
lautern, diese jedoch in keiner Weise einzuschranken. Dem Fachmann sind aufgrund 
der Beschreibung und der Beispiele weitere Ausfuhrungsformen zuganglich, die eben- 
falls umfaBt sind. 



Fig. 1 zeigt die Charakterisierung und Aufreinigung von Haliotis tuberculata 
Hamocyanin (HtH): 

(a) Elektronenmikroskopie von negativ gefarbtem Gesamt-HtH, das durch Ultrazen- 
trifugation von Zell-freier Hamolymphe aufgereinigt wurde; 

(b) SDS-Polyacryamid-Gelelektrophorese (7,5 % Polyacrylamid) von HtH1 im Ver- 
gloich zu KLH (MW 370 kDa); 

(c) Native Polyacrylamid-Gelektrophorese (5 % Polyacrylamid) der HtH- 
Untereinheiten-Praparation, wobei die Anode am unteren Rand liegt; 

r (d) Gekreuzte Immunelektrophorese der beiden HtH-Untereinheiten unter Verwen- 
dung von anti-HtH-Antikorpern aus Kaninchen; 

(e) Elektronenmikroskopie der verbleibenden HtH1-Didekamere (weifSe Pfeile) nach 
der selektiven Dissoziation von HtH2 (schwarze Pfeile); 

(f) Elutionsprofil der Gelfiltrationschromatographie (Biogel A1 5m) in Gegenwart von 
Ammoniummolybdat/Polyethylenglykol-Losung (pH 5,9) nach der selektiven Dis- 
soziation von HtH2 in seine Untereineinheit und nachfolgender Anreicherung von 
HtH1 durch Ultrazentrifugation; 
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(g) Native Poiyacrylamid-Gelelektrophorese (6,5 % Polyacrylamid) von durch 

Gelchromatographie aufgereinigten HtH1- und HtH2-Untereinheiten im Vergleich 
zum Ausgangsmaterial; 

(h,i) Gekreuzte Immunelektrophorese von chromatographisch aufgereinigten HtH- 
Untereinheiten; und 

(j,m) Gekreuzte Immunelektrophorese der aufgereinigten HtH-Untereinheiten unter 
Verwendung von anti-KLH-Antikorpern aus Kaninchen, die fur KLH1 bzw. KLH2 
spezifisch sind. 

•Fig. 2 zeigt die Untersuchung der Untereinheiten-Organisation von HtH1 , wobei fur die 
Immunelektrophorese anti-HtH1-Antikdrper aus Kaninchen verwendet wurden 
und die Anode sich auf der linken Seite befand: 

(a) Gekreuzte Immunelelektrophorese nach limitierter Proteolyse von HtH1 mit Hilfe 
von Elastase; 

(b) SDS-Polyacrylamid-Gelelektrophorese (7,5 % Polyacrylamid) von Elastase- 
gespaltener HtH1-Untereinheit; 

(c,d,g-j,l,n,p) Gekreuzte Immunelektrophorese der Elastase-Spaltprodukte der HtH1- 
untereinheit; 

(e) Gekreuzte Immunelelektrophorese nach limitierter Proteolyse von HtH1 mit Hilfe 
von V8 Protoaso; 

(f) SDS-Polyacrylamid-Gelelektrophorese (7,5 % Polyacrylamid) von V8 Protease- 

• gespaltener HtH1-Untereinheit und 
(k,m,o) Gekreuzte Immunelelektrophorese nach limitierter Proteolyse von HtH1 
mit Hilfe der drei angegebenen Proteasen. 

Fig. 3 zeigt die Auftrennung von proteolytischen Spaltprodukten der Untereinheit HtH1 
mit Hilfe von HPLC. 

Fig. 4 zeigt die cDNA-Sequenz von HtH1 in Verbindung mit der Intronstruktur. 

Fig. 5 zeigt die abgeleitete Primarstruktur von HtH1. 
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Fig. 6 zeigt die cDNA-Sequenz von HtH2 in Verbindung mit der Intronstruktur. 
Fig. 7 zeigt die abgeleitete Primarstruktur von HtH2. 

Fig. 8 zeigt die cDNA-Sequenz von KLH1 in Verbindung mit der Intronstruktur. 
Fig. 9 zeigt die abgeleitete Primarstruktur von KLH1. 

Fig. 10 zeigt die cDNA-Sequenz von KLH2 in Verbindung mit der Intronstruktur. 
Fig. 1 1 zeigt die abgeleitete Primarstruktur von KLH2. 

BEISPIELE 

Material und Methoden 

1 Gewinnen der Hamolymphe und Isolieren von Hamocyanin 

Individuen des europaischen Seeohrs Haliotis tuberculata aus dem Bereich derfran- 
zosischen Atlantikkuste wurden von S.M.E.L (Blainville sur Mer, Frankreich) und der 

• Firma Biosyn (Fellbach, Deutschland) bereitgestellt. Die Tiere wurden in einem 300 I 
Seewasser-Aquarium bei 1 7 ° C gehalten und mit Braunalgen gefiittert. Zur Entnahme 
der Hamolymphe wurden die Seeohren in einem verschlossenen Plastiksack auf Eis 
gestellt. Nach einer Stunde waren grofce Volumina an Hamolymphe durch ihre Haut se- 
zerniert worden. Es stellte sich heraus, dafc das durch dieses Verfahren erhaltene Ha- 
mocyanin identisch ist mit dem Hamocyanin, das durch Einschneiden einer Mulde in den 
Fufc heruntergekuhlter Meeresschnecken unter Verwendung einer Skalpellklinge ge- 
sammelt werden konnte. Die Blutzellen wurden von der Hamolymphe durch Zentrifuga- 
tion bei 800 g uber 30 min bei 4 ° C abgetrennt. Das gesamte Hamocyanin wurde sofort 
danach durch praparative Ultrazentrifugation bei 30000 g uber 4 Stunden bei 4 ° C se- 
dimentiert. Der Uberstand wurde verworfen und das blaue Hamocyanin-Pellet wurde 
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uber Nacht in "Stabilisierungs-Puffer" (0,05 M Tris, 5 mM CaCI 2 , 5 mM MgCI 2 , 0,15 M 
NaCI, 1 mM PMSF, pH 7,4) suspendiert und bei 4 0 C gelagert. 

Intaktes HtH1 wurde unter Verwendung des von Harris et al., 1995, supra, beschriebe- 
nen Verfahrens aus dem gesamten HtH durch selektive Dissoziation von HtH2 in Am- 
moniummolybdat/Polyethylenglykol (1%/0,2%)-Lbsung, pH 5,9 und nachfolgender Ultra- 
zentrifugation erhalten. Das entstandene, teilweise aufgereinigte HtH1 -Pellet wurde auf- 
gelost und durch Gelfiltration auf einer Biogel A1 5m-Vorrichtung zur Homogenitat aufge- 
reinigt. Der letzte Schritt ergab geringe Mengen von aufgereinigtem HtH2. Natives HtH1 

• und HtH2 wurde durch Dialyse gegen "Dissoziationspuffer" (0,13 M Glycin/NaOH, pH 
9,6) bei 4 ° C uber Nacht quantitativ in die Untereinheiten dissoziiert; die Gegenwart von 
EDTA war nicht erforderlich. 1 mM PMSF wurde bei jeder Stufe der Aufreinigung hinzu- 
gefUgt, urn die Proteolyse zu hemmen. 

2. Elektronenmikroskopie 

Konventionelles "negative staining" wurde mit dem Einzel-Tropfen-Verfahren (Harris und 
Home in Harris, J.R. (Herausgeber) Electron microscopy in biology, (1991), IRL Press 
Oxford, S. 203-228) durchgefuhrt. Kohlenstofftrager-Filme wurde anfanglich uber 20 Se- 

kund e n gluhontlad e n, urn sio hydroph il und fur das Protoin adsorptiv zu mach e n. Man 

laflt die Proteinproben an den Kohlenstoffilmen uber 60 Sekunden adsorbieren. Sodann 

• werden die Puffersalze durch sequentielles Waschen mit vier aufeinanderfolgenden 20 
nl Wassertropfen entfernt. Die Gitter werden schliefilich mit einem 20 |xl Tropfen 5 % 
wafirigen Ammoniummolybdats, enthaltend 1 % Trehalose (pH 7,0) negativ gefarbt und 
bei Raumtemperaturtrocknen gelassen. Fur die elektronenmikroskopische Untersu- 
chung wird ein Zeiss EM 900 Transmissionselektronenmikroskop verwendet. 

3. Polyacrylamid-Gel-Elektrophorese und Immunelektrophorese 

SDS-Polyacrylamid-Gel-Elektrophorese (SDS-PAGE) wurde gemaft des Verfahrens von 
Laemmli (Nature 227 (1970), 670-685) durchgefuhrt. Zur nativen PAGE wurde ein alka- 
lisches System gemaG Markl et al. (1979) J. Comp. Physiol. 133 B, 167-175 mit einem 
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0,33 M Tris/Borat, pH 9,6 als Gelpuffer und 0,065 M Tris/Borat, pH 9,6 als Elektroden- 
puffer verwendet. Gekreuzte und "crossed-line" Immunelektrophorese (IE) wurden ge- 
nial* Weeke (Scand. J. Immunol. 2 (1973), Suppl. 1, 47-56) bzw. Kroll (Scand. J. Immu- 
nol. 2, Suppl. 1 (1973), 79-81) durchgefuhrt. Kaninchenantikbrper wurden von Charles 
River Deutschland (Kisslegg, Deutschland) gegen dissoziiertes Gesamt-HtH und aufge- 
reinigtes HtH1 erzeugt. Das Immunisierungsverfahren wurde durchgefuhrt gemafS Markl 
und Winter (J. Comp. Physiol. 159B (1989), 139-151). 

4. Limitierte Proteolyse und Isolierunq der Fraqmente 

• Die limitierte Proteolyse wurde bei 37 ° C in 0,13 M Glycin/NaOH, pH 9,6 durch Hinzufu- 
gen eines der nachstehenden Enzyme (Sigma, Deisenhofen, Deutschland), die in 0, 1 M 
NH4HCO3, pH 8,0 gelost waren, durchgefuhrt: Staphylococcus aureus V8-Protease Typ 
XVII (8400), Papain Typ II aus Papaya-Milch (P-3125), Rinder-Pankreas-Elastase Typ IV 
(E-0258), Chymotrypsin und Trypsin. Die Hamocyanin-Konzentration lag zwischen 1 
und 10 mg/ml. Die Endkonzentration des Enzyms betrug 2 % (Gewicht/Gewicht). Die 
Proteolyse wurde nach 5 Stunden durch Einfrieren auf -20 0 C beendet. Das HPLC- 
Verfahren wurde auf einer Vorrichtung von Applied Biosystems (BAI, Bensheim, 
Deutschland) durchgefuhrt, die mit einem ModelMOOOS-Dioden-Array-Detektor ausge- 
s t a tt e t war. Die p r o t eo l y ti schen Fragmente wu rde n auf k lein e M ono -Q-A nio naus- 

• tauscher-Saule aufgetragen (Pharmacia, Freiburg, Deutschland), die mit 0,02 M 
Tris/HCI, pH 8,0 aquilibriert worden war und mit einem linearen Natriumchlorid- 
Gradienten (0,0 M - 0,5 M CaCI) im gleichen Puffer bei einer FluRrate von 1 ml/min elu- 
iert wurden. Alternativ wurden die proteolytischen Fragmente durch Ausschneiden der 
Banden aus nativen PAGE-Gelen (Markl et al., 1979) J. Comp. Physiol. 133 B, 167-175 
isoliert, nachdem sie zuvor mit dem Roti-White-System (Roth, Karlsruhe, Deutschland) 
gemafc Fernandez-Patron et al. (1995) Anal. Biochem. 224, 203-21 1 invers-gefarbt wor- 
den waren. Zur nachfolgenden Spaltung mit einem zweiten Enzym wurden die isolierten 
Fragmente zuerst Ubernacht gegen 0,13 M Glycin/NaOH, pH 9,6 dialysiert, um NaCI zu 
entfernen. 

5. Aminosaurensequenzanalvse 
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Die durch das HPLC-Verfahren erhaltenen Proteine wurden in SDS-enthaltendem Pro- 
benpuffer denaturiert und durch SDS-PAGE (Laemmli, 1970, supra; 7,5 % Polyacryla- 
mid) aufgetrennt. Urn die Blockierung des NH 2 -Terminus zu verhindern wurde 0,6 % 
(Gewicht/Gewicht) Thioglykolsaure zum Kathodenpuffer (Walsh etal., Biochemistry 27 
(1988), 6867-6876) hinzugefugt. Die Proteinbanden wurden durch Elektro-Transfer auf 
ProBlot-Membranen (Applied Biosystems, Deutschland) in einer vertikalen Blotting- 
Kammer ubertragen (25 mM Borat-Puffer, pH 8,8, enthaltend 2 mM EDTA; 10 min/100 
mA, 15 min/200 mA, 12 h/300 mA). Der Nachweis der einzelnen Polypeptide auf den 

• Membranen wurde mit der Ponceau-S-Farbung durchgefuhrt. Die interessierenden Po- 
lypeptid-Banden wurden ausgeschnitten und in einer 477A-Protein-Sequenzier-Vor- 
richtung von Applied Biosystems sequenziert. Die Mengen der auf die Sequenziervor- 
richtung aufgetragenen Polypeptide lag im unteren pmol-Bereich. 



6. cDNA-Klonierung und Sequenzanalyse 



Eine Lambda-cDNA-Expressionsbibliothek wurde aus Poly(A + )-RNA aus Haliotis Man- 
telgewebe unter Verwendung des Vektors Lambda ZAP Express ® gemafc den Herstel- 
leranweisungen (Stratagene, Heidelberg, Deutschland) hergestellt. Die Klone wurden 
unlei Veiwendung von HtH-spezlflschen Kaninchenantikorpern isoliert. Die Nukleo- 
tidsequenzierung wurde auf beiden Strangen unter Verwendung des Taq Dye deoxy 
|Terminator®-Systems durchgefuhrt. Die Anordung der Sequenzen wurde mit der Soft- 
ware CLUSTAL W (1.7)® und TREEVIEW ©(Thompson et al., Nucl. Acids Res. 22 
(1994), 4673-4680) durchgefuhrt. 



Bejspjej 1: 

Isolierung von HtH und Auftrennung zweier unterschiedlicher Typen (HtH1 und 
HtH2) 

Die Hamolymphe wurde aus adulten Seeohren gewonnen. Die Blutzellen wurden durch 
Zentrifugation entfernt und das Hamocyanin wurde sodann durch Ultrazentrifugation 
sedimentiert. Das blaue Hamocyanin-Pellet wurde in "Stabilisierungspuffer" (pH 7,4) 
wieder aufgelost und in der Elektronenmikroskopie untersucht (Figur 1a). Es bestand 
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hauptsachlich aus typischen Di-Dekameren, begleitet von einem kleinen Anteil an De- 
kameren und Tridekameren. Die Denaturierung in 2 % SDS in Gegenwart reduzierender 
Substanzen und anschlieftenderSDS-PAGE-Trennung ergab eine einzige Bande, die 
dem Poiypeptid mit einem scheinbaren Molekulargewicht von 370 kDa entsprach, wel- 
ches nur geringfugig unterhalb des scheinbaren Untereinheiten-Gewichts von KLH 
(Figur 1b) liegt. Die vollstandige Dissoziation derOligomere wie der Di-Dekamere in die 
nativen Polypeptide (Untereinheiten) wurde erreicht durch Ubernacht-Dialyse von HtH 
gegen "Dissoziationspuffer" (pH 9,6). Natives PAGE-Verfahren, das auf diese Proben 
angewendet wurde, ergab eine Haupt- und eine Neben-Komponente (Figur 1c). Die ge- 

•kreuzte Immunelektrophorese (gekreuzte IE) unter Verwendung von gegen aufgereinig- 
tes Gesamt-HtH-erzeugten polyklonalen Kaninchen-Antikorpern zeigte zwei Komponen- 
ten, die immunologisch unterschiedlich sind, jedoch die klassische Reaktion einer teil- 
weise immunologischen Identitat aufweisen (Figur 1d). Ihre praparative Isolierung (Figur 
1 e-i) zeigte, daft sie die Untereinheiten von zwei unterschiedlichen HtH-Typen darstel- 
len, bezeichnet als HtH1 und HtH2, und die Muster der nativen PAGE- und gekreuzten 
lE-Verfahren konnten jeder einzelnen zugeordnet werden (Figur 1c, d). 

Die Auftrennung von HtH1 und HtH2 wurde gemaft des Verfahrens zur selektiven Dis- 
soziation gemaft Harris et al., 1995, supra, durchgefuhrt. In Ammoniummolybdat/Poly- 

el l l y l miylykul wa i H im i m O l iyumeiB i i-Zuslaiid (D i -Dekame r e) vo ll stand ig stabil, wohin- 

gegen HtH2 vollstandig in die Untereinheiten dissoziierte (Figur 1e). Dies ermdglichte 

•die quantitative Sedimentation von HtH1 in der Ultrazentrifuge, wohin gegen der groftte 
Teil des HtH2 im Uberstand verblieb. Aus dem wieder aufgelosten Pellet wurden grofte 
Mengen an HtH1 durch Gelfiltrationschromatographie zur Homogenitat aufgereinigt, 
welche auch geringe Mengen an reinem HtH2 ergab (Figur 1f). Die Fraktionen wurden 
durch native PAGE (Figur 1g) und gekreuzte IE (Figur 1h, i) untersucht. Das Verfahren 
der selektiven Dissoziation von HtH2 entfernte samtliche Tri-Dekamere aus den Proben, 
welches nahelegt, daft die letzteren aus HtH2, jedoch nicht aus HtH1 aufgebaut sind 
(Figur 1e). Das selektive Dissoziationsverhalten von HtH2 und auch die Fahigkeit, Ag- 
gregate zu bilden, die grofter als in vivo -Di-Dekamere sind, entspricht den Eigenschaf- 
ten von KLH2. Umgekehrt ahnelt die Stabilitat von HtH1 unter diesen Bedingungen und 
seine Unfahigkeit, sich zu grofteren Aggregaten als Di-Dekameren zu assemblieren, 



dem Verhalten von KLH1 . Diese Verwandtschaft wird weiter belegt durch die Reaktion 
von Anti-KLH1 bzw. Anti-KLH2 Antikdrpern gegen die beiden HtH-Typen (Figur 1j-m). 



Beispiel 2: 

Analyse der Organisation der HtH1-Untereinheit 

Die acht funktionellen Einheiten (FU's, haufig als "funktionelle Domanen" bezeichnet), 
die eine Mollusken-Hamocyanin-Untereinheit bilden, unterscheiden sich in der Primar- 
struktur und weisen keine immunologische Kreuz-Reaktivitat auf, wie sich aus gekreuz- 
ter IE ergibt. Im Fall der aufgereinigten HtH1 Untereinheit (Figur 1g, h) wurden geringe 

• Konzentrationen fiinf unterschiedlicher Proteasen (Elastase, V8-Protease, Papain, 
Trypsin und Chymotrypsin) verwendet, welche die Peptid-Bindungen zwischen benach- 
barten FU's von KLH1 und KLH2 gespalten hatten (Gebauer et al., 1994, supra, Sohn- 
gen et al., 1997, supra). Die Spaltprodukte wurden durch gekreuzte IE und SDS-PAGE 
(Fig. 2) untersucht. Elastase-Behandlung erzeugt acht einzelne FU's, abgeleitet aus der 
Anzahl an unterschiedlichen Immunprazipitations-Gipfeln in der gekreuzten IE (Fig. 2a) 
und mit dem scheinbaren Molekulargewicht von ca. 50 kDa des Hauptteils der Spaltpro- 
dukte in SDS-PAGE (Fig. 2b). Ein weiterer Prazipitationsgipfel wurde als FU-Dimer er- 
kannt, welches durch unvollstandige Spaltung des Segments ab (Fig. 2a) entstand. 

Durch HPLC-Verfahren mit einer Mono-Q-Saule (Fia. 3a) wurden zwei der Elastase- 

Spaltprodukte in einer ausreichenden Reinheit erhalten, urn durch "crossed-line-IE" ihre 

• Ware Zuordnung zu zwei der acht Prazipitationsgipfel (Fig. 2c,d) zu ermoglichen. Die 
anderen vier Proteasen wiesen unterschiedliche Spaltmuster auf, die aus Gemischen 
einzelner FU's und grdfierer Fragmente, enthaltend zwei, drei Oder mehrere FU's be- 
standen (z.B. Fig. 2 e,f). Viele von ihnen waren durch das HPLC-Verfahren in ausrei- 
chender Menge angereichert (Fig. 3b-e), urn ihre Identifikation in ihren entsprechenden 
SDS-PAGE- und gekreuzten lE-Mustern zu ermoglichen. Eine Anzahl dieser Kompo- 
nenten wurde N-terminal durch Blot-Transfer von SDS-Gelen auf ProBlot®-Membrane 
(Tabelle I) sequenziert. Die Resultate wurden mit N-terminalen Sequenzen verglichen, 
die aus dem scheinbar orthologen Protein in Megathura crenulata, KLH1 (Tabelle I), er- 
halten worden waren, von dem die vollstandige FU-Anordnung verfugbar ist (Sohngen 
et al., 1997, supra; vgl. Fig. 5b). Das Ergebnis des gesamten Ansatzes fuhrte zur Be- 
stimmung der vollstandigen FU-Anordnung innerhalb der HtH1 -Untereinheit (Fig. 2a). 
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Insbesondere ergab die Spaltung der HtH1-Untereinheit (1-abcdefgh) mit V8-Protease 
vier Prazipitationsgipfel in der gekreuzten IE (Fig. 2e). Das SDS-PAGE-Verfahren zeigte 
ftinf unterschiedliche Fragmente (Fig. 2f): 220 kDa (5 FU's), 185 kDa(4 FU's), 100 kDa 
(2 FU's), 55 kDa(1 FU) und 46 kDa(1 FU). Das 100 kDa-Fragment wurde durch das 
HPLC-Verfahren (Fig. 3b) isoliert und durch N-terminale Sequenzierung als 1-ab identi- 
fiziert, da die Sequenz identisch zu derjenigen der intakten Untereinheit war (Tabelle I). 
In dem "crossed-line" lE-Verfahren verschmolz 1-ab mit drei Prazipitationsgipfeln des 
Elastase-Spaltmusters. Aufgrund der Auswertung ergab sich, daft sie die Fragmente 1- 
ab, 1-a bzw. 1-b darstellen (Fig. 2g). Jedoch verblieb es unklar, welcher Gipfel 1-a und 
Iwelcher 1-b darstellt. In einem zweiten Schritt wurde das HPLC-aufgereinigte 1-ab durch 
Elastase in seine Komponenten-FU's gespalten, aus denen eine durch das native PA- 
GE-Gel-Streifenverfahren eluiert werden konnte und dem Elastase-Muster durch das 
"crossed-line" lE-Verfahren (Fig. 2h) zugeordnet und N-terminal sequenziert wurde. 
Diese Komponente wies die gleiche N-terminale Sequenz wie die gesamte Untereinheit 
auf und war deshalb identisch zu 1-a. Somit ist die zweite FU des 100 kDa-Fragments 1- 
b (Fig. 2a; Tabelle I). Ebenso wurden HPLC-aufgereinigtes 1-c und 1-h erhalten (Fig. 
3b), durch N-terminale-Sequenzahnlichkeiten zu den entsprechenden FU's in KLH1 
(Tabelle I) identifiziert und durch das "crossed-line" lE-Verfahren ihren entsprechenden 
P i azipilaliu ii by i ple li i in dem Elaslase-Musle i zuyeo r dnet (F i g. 2 I .J). We l te r h i n wurden 1- 
a, 1-b, 1-c und 1-h identifiziert (Fig. 2a). Unter Verwendung von Papain zur Untereinhei- 
Jten-Spaltung wurden funf unterschiedliche Gipfel in dem gekreuzten lE-Verfahren (Fig. 
k) erhalten. Aus einer solchen Probe wurde ein 100 kDa-Fragment (2 FU's) durch das 
HPLC-Verfahren (Fig. 3c) aufgereinigt, welches gemafi des "crossed-line" lE-Verfahrens 
das bereits identifizierte FU 1-h und eine der vier noch nicht identifizierten FU's enthielt 
und deshalb 1-gh darstellen muft (Figs. 2k, 3c). Tatsachlich wies dieses Fragment eine 
N-terminale Sequenz auf, die Ahnlichkeiten zu KLH1-g (Tabelle I) zeigte. Zur weiteren 
Bestatigung wurde das HPLC-aufgereinigte Fragment 1-gh mit Elastase in seine Be- 
standteil-FU's gespalten, aus denen 1-g aufgereinigt und durch N-terminale Sequenzie- 
rung identifiziert wurde. Es wurde durch "crossed-line" lE-Verfahren seinem Gipfel in 
dem Elastase-Spaltmuster zugeordnet (Fig. 21). 
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Das 220 kDa-Fragment aus der V8-Protease-Spaltung (Fig. 2e, f) wurde HPLC-auf- 
gereinigt (Fig. 3b) und fusionierte im "crossed-line" lE-Verfahren mit 1-h, 1-g und drei 
noch nicht identifizierten Gipfeln des Elastase-Spaltmusters. Weiterhin wurde das 185 
kDa-Fragment in ausreichender Reinheit erhalten (Fig. 2e, f; 3b), und es wurde gezeigt, 
daft sie die gleichen Komponenten mit Ausnahme von 1-h enthielten. Dies legte nahe, 
daG das 22 kDa und das 185 kDa-Fragment 1-defgh bzw. 1-defg sind. Tatsachlich war 
die N-terminale Sequenz praktisch identisch und zeigte weiterhin Ahnlichkeit zu KLH1-d 
(Tabelle I). Die Spaltung der HtH1-Untereinheit mit Trypsin ergab eine Vielzahl an Kom- 
ponenten in dem Molekulargewichtsbereich von ein bzw. zwei FU's (Fig. 2m). Mehrere 

• der Komponenten wurden in HPLC-Fraktionen angereichert (Fig. 3d). Ein 100 kDa- 
Fragment erwies sich als besonders nutzlich, da es die gleich N-terminale Sequenz wie 
das Fragment 1-defg aus der V8-Protease-Spaltung aufwies (Tabelle I); deshalb sollte 
das 100 kDa-Fragment 1-de darstellen. In dem "crossed-lined" lE-Verfahren fusionierte 
diese Komponente mit zwei der drei noch nicht identifizierten FU-Gipfeln des Elastase- 
Spaltmusters (Fig. 2n), welches deshalb 1-d und 1-e darstellen sollte, und somit eine 
einzige Moglichkeit fur 1-f ubrig liefc. Das "crossed-line" lE-Verfahren zeigte auch, dali in 
der 1-de Fraktion weiterhin FU 1-f vorhanden war (Fig. 2n). Die Identifikation von 1-f 
bestatigte durch Spaltung der Untereinheit mit Chymotrypsin (Fig. 2o) und nachfolgen- 
dem HPLC-Verfahren (Fig. 3e). Diese Spaltung ergab unter anderem ein 95 kDa- 

Fragment (2 FU'o) wolchoo im "croaood lino" -I E - VorfQhr o n mit 1 - g und e in e m zweit e n 

Gipfel (Fig. 2p) fusionierte und deshalb entweder 1-gh (welches ausgeschlossen werden 

• konnte, da 1-h bereits identifiziert war), Oder 1-fg (welches sinnvoll erscheint aufgrund 
des weiteren betreffenden Peaks, der zu dem verbleibenden Kandidaten identisch war) 
sein konnte. Tatsachlich zeigte dieses Fragment eine neue N-terminale Sequenz, wel- 
che in gewisser Weise zu KLH1-f ahnlich ist (Tabelle I). Das letzte Problem bestand nun 
darin, die zwei verbleibenden FU-Gipfel 1-d bzw. 1-e zuzuordnen. Dies wurde unter 
Verwendung von HPLC-isolierten FU's aus Proben gelost, in denen die Untereinheit mit 
Elastase gespalten worden war. (Fig. 2c, d; 3a). Die saurere Komponente in dem ge- 
kreuzten lE-Verfahren war 1-d abgeleitet aus seiner N-terminalen Sequenz, welche 
identisch ist mit der von 1-defgh (Fig. 2c; Tabelle I), wohingegen die basischere Kompo- 
nente des 1-d/1-g-Paares eine neue N-terminale Sequenz (Tabelle I) aufwies und des- 



28 



halb 1-e (Fig. 2a) sein mufcte. Somit war die Struktur der funktionellen Einheiten der 
Untereinheit HtH1 aufgeklart. 



Beispiel 3: 

Vergleich der Molekulargewichte und N-terminalen Sequenzen der biochemisch isolier- 
ten funktionellen Einheiten (FU's) aus HtH1 und KLH1. Die unterschiedlichen FU's, jede 
mit einer intakten binuklearen Kupfer-Bindungsstelle, wurden durch limitierte Proteolyse 
als globulaYe Segmente aus ihrer grolieren Einheit freigesetzt; vgl. Abschnitt "Isolierung 
und Analyse der Einheiten aus HtH1". Die KLH1-Daten wurden aus Sohngen et al., su- 
Ipra, entnommen. Die Zuordnung als tatsachliche Einheit erfolgte aufgrund des Moleku- 
largewichtes und des immunologischen Verhaltens (vgl. Fig. 2). Das ungewdhnlich 
niedrige Molekulargewicht von isoliertem HtH1-d konnte bedeuten, dafc ein grofces Pep- 
tid C-terminal abgespalten wurde. 

TABELLE I 



Funktionelle Einheit Masse (kDa) 
HtH1-a 53 



KLH ' l-a 
HtH1-b 
|KLH1-b 
HtH1-c 



-5tr 
48 
45 
46 



N-terminale Sequenz 

DNWRKD VS HLTDD E VQ 



EMLVRKDVtlRL 

? 
? 

FEDEKHS LRIRKNVDSLTPE ENTNERLR 



TABELLE I 



Funktionelle Einheit 

KLH1-C 

HtH1-d 

KLH1-d 

HtH1-e 

KLH1-e 



Masse (kDa) N-terminale Sequenz 

45 KVPRSRLIRKNVDRLTPSE 

40 VE E VTGAS H I RKNLNDLNTGEM 

50 EVTSANRIRKNIENLS 

49 ILDHDHEEEILVRKNIIDLSP 

50 ? 
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HtH1-f 50 KLNSRKHTPNRVRHELSSLSSRDIASLKA 

KLH1-f 45 HHLSXNKVRHDLSTL 

HtH1-g 45 DHQSGS IAGSGVRKDVNTLTKAETDNLRE 

KLH1-g 45 SSMAGHFVRKDINTLTP 

HtH1-h 55 DEHHDDRLADVL I RKE VD FL S LQEANA I KD 

KLH1-h 60 HEDHHED I LVRKNI HSL 



Beispiel 4: 




Klonierung von HSmocyanin-cDNA 

1. Zur Klonierung der cDNA von Hamocyanin wurde mRNA aus dem Mantelgewebe 



des jeweiligen Mollusken isoliert. Der erste cDNA-Strang wurde durch reverse Trans- 
kription mit Oligo(dT) als Primer erhalten. Der zweite Strang wurde durch konventio- 
nelle Synthese mit random Primern erhalten. Die so erhaltene cDNA wurde in einen 
Lambda-Expressionsvektor kloniert unter Bildung einer cDNA-Expressionsbibliothek. 
Unter Verwendung eines anti-Hamocyanin-Antikorpers wurde die Bibliothek unter 
geeeigneten Bedingungen abgesucht, wobei positive Klone erhalten wurden. Diese 
positiven Klone wurden isoliert, sequenziert und charakterisiert. 



2. Aus dem N-terminalen Bereich eines erhaltenen positiven Klons wurde eine cDNA- 

• Sonde hergestellt, mit der die cDNA-Bibliothek abgesucht wurde. Die erhaltenen po- 
sitiven Klone werden wiederum isoliert, sequenziert und charakterisiert. 

3. Urn noch weiter 5' gelegene Sequenzen zu erhalten, wurde eine weitere Expressi- 
onsbibliothek aus cDNA hergestellt, die mit Hilfe einer Kombination von Hamocyanin- 
spezifischen und „random"-Primern erhalten wurde. Diese cDNA-Bibliothek wurde mit 
cDNA-Sonden, die den „N-terminalen" Bereichen der unter (2.) erhaltenen positiven 
Klone entsprechen, abgesucht. Die erhaltenen positiven Klone wurden isoliert, se- 
quenziert und charakterisiert. 
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Beispiel 5: 

Klonierung von Hamocyanin-Genen 

Genomische DNA wurde gemafl Standard verfahren isoliert. Die PCR-Reaktion wurde 
mit Hilfe von Hamocyanin-spezifischen Primern durchgefuhrt, um die Genabschnitte der 
interessierenden Hamocyanine zu amplifizieren. Die erhaltenen Amplifikationsprodukte 
wurden in einen geeigneten Vektor (beispielsweise pGem T Oder pGem T easy 
(Promega, Mannheim) kloniert, sequenziert und charakterisiert. 



k Bejspjej 6: 

f Rekombinante Expression von Hamocyanin 

Mit einem cDNA-Klon, der die kodierende Sequenz fur HtH-1d enthalt, wurde eine PCR- 
Reaktion durchgefuhrt, um spezifisch die kodierende Sequenz der Domane 1d zu 
amplifizieren. Als Primer wurden synthetisch hergestellte Oligonukleotide verwendet. 
Primer 1 (stromaufwarts) umfafit sechs Nukleotide des Endes der Domane HtH-1c, eine 
Sacl-Schnittstelle und 12 Nukleotide des Endes der Domane HtH-1d. 
Primer 2 (stromabwarts) umfaBt sechs Nukleotide des Anfangs der Domane HtH1-e, ei- 
ne Sa/I-Schnittstelle und eine HtH1 -d spezifische Sequenz. 

k PCR-Bedingungen: 2 min 95°C 
30 sec 95°C 
30 sec 55°C 
1 min 72°C 
35 Zyklen 
10 min 72°C 

Das Amplifikat wurde in dem pGEM T easy PCR Klonierungsvektor (Promega) in XL-1 
Blue (Stratagene) kloniert. Nach Isolation des rekombinanten Plasmids und Restriktion 
mit Sad und Sa/I konnte die cDNA der Domane 1d isoliert werden. Der Expressionsvek- 
tor pQE30 (Qiagen) wurde ebenfalls mit den entsprechenden Enzymen restringiert. 
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AnschlieGend wurde die Ligation zwischen der HtH-1d-cDNA (restringiert mit Sac\ und 
Sa/I) und pQE (restringiert mit Sad und Sa/I) durchgefuhrt. Somit ist eine gerichtete 
Klonierung der cDNA, kodierend fur HtH-1d, in einen Expressionsvektor mdglich. Die 
Expression von HtH1-d in pQE in XL-1 Blue erfolgt gemaii Herstelleranleitung. Die Ex- 
pression weiterer HtH1-, HtH2- Oder KLH1- oder KLH2-Domanen kann analog erfolgen. 
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SEQUENZPROTOKOLL 

<110> Biosyn Arzneimittel GmbH 

<120> Nukleinsauremolekul, umfassend eine fur ein Hamocyanin 
kodierende Nukleinsauresequenz 

<130> P30370B-01996 

<140> 
<141> 



<170> Patentln Ver. 2.1 

<210> 1 
<211> 1269 
k<212> DNA 
p213> Haliotis tuberculata 

<220> 

<223> HtHl-a 
<400> 1 

ggcttgttca gtttctactc gtcgcccttg tggcgggggc tggagcagac aacgtcgtca 60 
gaaaggacgt gagtcacctc acggatgacg aggtgcaagc tctccacggc gccctccatg 120 
acgtcactgc atctacaggg cctctgagtt tcgaagacat aacatcttac catgccgcac 180 
cagcgtcgtg tgactacaag ggacggaaga tcgcctgctg tgtccacggt atgcccagtt 240 
tccccttctg gcacagggca tatgtcgtcc aagccgagcg ggcactgttg tccaaacgga 300 
agactgtcgg aatgccttac tgggactgga cgcaaacgct gactcactta ccatctcttg 360 
tgactgaacc catctacatt gacagtaaag gtggaaaggc tcaaaccaac tactggtacc 420 
gcggcgagat agcgttcatc aataagaaga ctgcgcgagc tgtagatgat cgcctattcg 480 
agaaggtgga gcctggtcac tacacacatc ttatggagac tgtcctcgac gctctcgaac 540 
aggacgaatt ctgtaaattt gaaatccagt tcgagttggc tcataatgct atccattact 600 
tggttggcgg taaatttgaa tattcaatgt caaacttgga atacacctcc tacgacccca 660 
cijLLydiiu yuuLcLLcyL: cdLuLyyuay uy LcLLcayy 720 — 



aactgcgagg aaagaatccc aatgcaatgg actgtgcaca tgaactcgct caccagcaac 780 

tccaaccctt caacagggac agcaatccag tccagctcac aaaggaccac tcgacacctg 840 

kctgacctctt tgattacaaa caacttggat acagctacga cagcttaaac ctgaatggaa 900 

Htgacgccaga acagctgaaa acagaactag acgaacgcca ctccaaagaa cgtgcgtttg 960 

Pcaagcttccg actcagtggc tttgggggtt ctgccaacgt tgttgtctat gcatgtgtcc 1020 

ctgatgatga tccacgcagt gatgactact gcgagaaagc aggcgacttc ttcattcttg 1080 

ggggtcaaag cgaaatgccg tggagattct acagaccctt cttctatgat gtaactgaag 1140 

cggtacatca ccttggagtc ccgctaagtg gccactacta tgtgaaaaca gaactcttca 1200 

gcgtgaatgg cacagcactt tcacctgatc ttcttcctca accaactgtt gcctaccgac 1260 
ctgggaaag 1269 

<210> 2 
<211> 1257 
<212> DNA 

<213> Haliotis tuberculata 

<220> 

<223> HtHl-b 
<400> 2 

gtcaccttga cccacctgtg catcatcgcc acgatgacga tcttattgtt cgaaaaaata 60 

tagatcattt gactcgtgaa gaggaatacg agctaaggat ggctctggag agattccagg 120 

ccgacacatc cgttgatggg taccaggcta cagtagagta ccatggcctt cctgctcgtt 180 

gtccacgacc agatgcaaaa gtcaggttcg cctgttgtat gcatggcatg gcatccttcc 240 

ctcactggca ccggctgttc gttacccagg tggaagatgc tcttgtacgg cgtggatcgc 300 
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ctatcggtgt tcct«ftgg gactggacaa 
caaatgagac gtacgtagac ccgtatggac 
atatatcttt tgaggaggga caccatcaca 
ccccagtcgc ttttggggag cattcccatc 
aggaagattt ctgcgacttt gagattcagt 
ggataggcgg ttccgaagat tactccatgg 
ttttctacct tcatcattcc aatgtcgatc 
tcaggagaca caagccatat caagcccact 
agccatttgc tttcccatca cctcttaaca 
cgactgacat ttatgactac gaggaagtgc 
gtgggatgaa ccttgaagaa atagaagaag 
tcttcgcggg atttctcctt gctggaatag 
ataaaccggg gaaccaacca ctcaaagctg 
aaatgccttg ggcgtttgac cgcttgtata 
tttctctcga tgtcgatgga gattatgaag 
acgctcttga tacggacctg attccacacg 



aacctatgac tcaccttcca gacttggcat 360 
atacacatca taatccattc ttcaatgcaa 420 
cgagcaggat gatagattcg aaactgtttg 480 
tgtttgatgg aatcctgtac gcatttgagc 540 
ttgagttagt ccataattct attcatgcgt 600 
ccaccctgca ttacacagcc tttgacccca 660 
gtctatgggc aatctggcaa gctcttcaaa 720 
gtgcacagtc tgtggaacag ttgccaatga 780 
acaacgagaa gacacatagt cattcagtcc 840 
tgcactacag ctacgatgat ctaacgtttg 900 
ctatacatct cagacaacag catgaacgag 960 
gaacatctgc acttgttgac attttcataa 1020 
gagatattgc cattcttggt ggtgccaagg 108O 
aggtcgaaat aactgactca ttgaagacac 1140 
tcacttttaa aattcatgat atgcacggaa 1200 
cagcagttgt ttctgagcca gctcacc 1257 



<210> 3 
<211> 1242 
<212> DNA 

<213> Haliotis tuberculata 
k<220> 

Tc223> HtHl-c 
<400> 3 

ctacctttga ggatgaaaag cacagcttac gaatcagaaa aaatgtcgac agcttgactc 60 

ctgaagaaac aaatgaactg cgtaaagccc tggagcttct tgaaaatgat catactgcag 120 

gtggattcaa tcagcttggc gccttccatg gagagcctaa atggtgccct aatcctgaag 180 

cggagcacaa ggttgcatgc tgtgttcatg gcatggctgt tttccctcat tggcacaggc 240 

ttcttgctct ccaggcggag aatgctctta gaaagcatgg gtacagtggt gctctaccat 300 

actgggattg gactcgcccc ctttcccaac ttcctgatct ggttagtcat gagcagtata 360 

cagatccttc cgaccatcac gtgaagcata acccgtggtt caatggccac atcgatacag 420 

taaatcagga taccaccaga agcgtacggg aggatcttta tcaacaacct gaatttggac 4 80 

atttcacgga tattgctcaa caagtcctct tagcattaga acaagatgac ttctgttcgt 540 

ttgaagtgca gtatgagatt tcccataatt ttatccatgc acttgtagga ggaaccgacg 600 

cttatggcat ggcatcgctg agatatacag catacgatcc aatctttttc ttgcatcatt 660 

caaacaccga caggatctgg gctatttggc aatccctgca aaaatacaga ggcaaaccgt 720 

acaacactgc caactgcgcc atagaatcta tgagaaggcc cctgcaacca tttggactaa 780 

gcagtgccat taaccctgac agaatcacca gagagcatgc tatcccgttt gat gtcttca 840 

aLayaga LaauiLLcaL LdLyLdtaLtj dLdUliUtggd a LL Laatggt ttgt cgattt 9UU 



cacaacttga tagagagctg gaaaaaatca agagtcacga aagagtattt gctggattct 960 

tgctgtcggg gattaaaaaa tctgctcttg tgaaattcga agtttgtact ccacctgata 1020 

ttgtcataa agcaggggag ttttatctac tcggggacga aaacgagatg gcttgggcct 1080 

tgaccgact tttcaagtat gatattactc aggttctgga agcaaaccat ctacacttct 1140 

„tgatcatct cttcattcgc tacgaagtct ttgatcttaa aggagtgagt ttgggaactg 1200 
acctgttcca cactgcaaat gtggtacatg attccggcac ag 1242 



<210> 4 
<211> 1239 
<212> DNA 

<213> Haliotis tuberculata 



<22 0> 

<223> HtHl-c 



<400> 4 

gcacccgtga tcgtgataac tacgttgaag 
atttgaacga cctcaatacc ggagaaatgg 
aggacgacgg aacatatgaa tctattgccc 
tgaatgatca taatattgcg tgttgtgtcc 
gactgtatgt ggttcaggtg gagaatgctc 
cttactggga gtggactgct cccatagacc 
acttcaattc ccgacaacag cggtacgacc 
ttgaaaacgc agtcacaaca agggacccac 
atgagaatgt tttacttgca ctggagcagg 



aagttactgg ggccagtcat atcaggaaga 60 
aaagccttag agctgctttc ctgcatattc 120 
agtaccatgg caaaccaggc aaatgtcaat 180 
atggtatgcc taccttcccc cagtggcaca 240 
tcctaaacag gggatctggt gtggctgttc 300 
atctacctca tttcattgat gatgcaacat 360 
ctaacccttt cttcagggga aaggttactt 420 
aagccgggct cttcaactca gattatatgt 480 
aaaattattg tgactttgaa attcagtttg 540 



agcttgttca taacgcactt cattccatgc tgggaggtaa agggcagtac tccatgtcct 600 
ccctggacta ttctgcgttt gatcccgtct tcttcctaca tcatgccaac acggacagac 660 
tgtgggcaat ctggcaggaa ctacaaagat tccgagaact gccttatgaa gaagcgaact 72 0 
gtgcaatcaa cctcatgcat caaccactga agccgttcag tgatccacat gagaatcacg 780 
acaatgtcac tttgaaatac tcaaaaccac aggacggatt cgactaccag aaccacttcg 840 
gatacaagta tgacaacctt gagttccatc acttatctat cccaagtctt gatgctaccc 900 
tgaagcaaag gagaaatcac gacagagtgt ttgcgggctt ccttcttcat aacataggaa 960 
cttctgctga cataactatc tacatatgtc tgcctgacgg acggcgtggc aatgactgca 1020 
gtcatgaggc gggaacattc tatatcctcg gaggcgaaac agagatgcct tttatctttg 1080 
accgtttgta taaatttgaa atcaccaaac cactgcaaca gttaggagtc aagctgcatg 1140 
gtggagtttt cgaactggag cttgagatca aggcatacaa cggttcctat ctggatcccc 12 00 
atacctttga tccaactatc atctttgaac ctggaacag 1239 

<210> 5 
<211> 1260 
<212> DNA 

<213> Haliotis tuberculata 



<220> 

<223> HtHl-e 



400> 5 

;acccatat cttggaccac gaccatgagg aagagatact tgtcaggaag aatataattg 60 
ttgagccc aagggagagg gtttctctag tcaaagcttt gcaaagaatg aagaatgatc 120 
jctccgctga tgggtaccaa gccattgcct ctttccatgc cctgccacca ctctgtccca 180 
atccatctgc agctcaccgt tatgcttgct gtgtccatgg catggctaca tttccccagt 240 
ggcacagact gtacactgtt caggttcagg atgccctgag gagacatggt tcacttgttg 300 
gtattcctta ctgggactgg acaaaaccag tcaacgagtt acccgagctt ctttcttcag 360 
caacatttta tcatccaatc cggaatatta atatttcaaa tccattcctc ggggctgaca 420 
tagaatttga aggaccgggc gttcatacag agaggcacat aaatactgag cgcctgtttc 480 
acagtgggga tcatgacgga taccacaact ggttcttcga aactgttctc tttgctttgg 54 0 
aacaggaaga ttactgcgat tttgaaatac aatttgagat agcccataat ggcatccaca 600 
catggattgg tggaagcgca gtatatggca tgggacacct tcactatgca tcatatgatc 660 
caattttcta catccaccat tcacagacgg acagaatatg ggctatttgg caagagctgc 720 
agaagtacag gggtctatct ggttcggaag caaactgtgc cattgaacat atgagaacac 780 
ccttgaagcc tttcagcttt gggccaccct acaatttgaa tagtcatacg caagaatatt 840 
caaagcctga ggacacgttt gactataaga agtttggata cagatatgat agtctggaat 900 
tggaggggcg atcaatttct cgcattgatg aacttatcca gcagagacag gagaaagaca 960 
gaacttttgc agggttcctc cttaaaggtt ttggtacatc cgcatctgtg tcattgcaag 1020 
tttgcagagt tgatcacacc tgtaaagatg cgggctattt cactattctg ggaggatcag 1080 
Lulu dLyyuudLLc yacaggcLL t ataagtatga cattactaaa actcttcacg 1140 



acatgaacct gaggcacgag gacactttct ctatagacgt aactatcacg tcttacaatg 1200 

*gaacagtact ctcgggagac ctcattcaga cgccctccat tatatttgta cctggacgcc 12 60 

■210> 6 

|211> 1251 
" P! <212> DNA 
<213> Haliotis tuberculata 

<220> 

<223> HtHl-f 
<400> 6 

ataaactcaa ctcacggaaa catacaccta acagagtccg ccatgagcta agtagcctta 60 

gttcccgtga catagcaagc ttgaaggcag ctttgacaag ccttcaacat gataatggga 120 

ctgatggtta tcaagctatt gctgccttcc atggcgttcc tgcgcagtgc cacgagccat 180 

ctggacgtga gatcgcctgt tgcatccacg gcatggcgac gtttcctcac tggcaccggt 240 

tgtacactct gcagttggag caagcgctgc gcagacacgg gtccagtgtt gctgttccat 300 

actgggactg gaccaagcca atcaccgaac tgccacacat tctgacagac ggagaatatt 360 

atgacgtttg gcaaaatgcc gtcttggcca atccgtttgc aagaggttat gtgaaaatta 420 

aagatgcatt tacggtgaga aatgtccagg aaagtctgtt caaaatgtca agttttggaa 480 

agcactcgct tctgtttgac caggctttgt tggctcttga acaaactgac tactgtgact 540 

tcgaagttca gtttgaagtg atgcataaca cgatccatta tctcgtagga gggcgtcaaa 600 

cgtacgcctt ctcctctctc gagtattcct catacgatcc aatcttcttt attcaccact 660 

cgtttgttga caaaatatgg gctgtatggc aagaactgca aagcaggaga catctacagt 720 

ttagaacagc tgattgtgct gtgggcctca tgggtcaggc aatgaggcct ttcaacaagg 780 
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atttcaacca caacc^^cc accaagaagc acgcagtccc taatf^Rta tttgattatg 840 

aagatcttgg ctataactat gacaaccttg aaatcagtgg tttaaactta aatgagatcg 900 

aggcgttaat agcaaaacgc aagtcacatg ctagagtctt tgctgggttc ctgttgtttg 960 

gattaggaac ttcggctgat atacatctgg aaatttgcaa gacatcggaa aactgccatg 1020 

atgctggtgt gattttcatc cttggaggtt ctgcagagat gcattgggca tacaaccgcc 1080 

tctacaagta tgacattaca gaagcattgc aggaatttga catcaaccct gaagatgttt 1140 

tccatgctga tgaaccattt ttcctgaggc tgtcggttgt tgctgtgaat ggaactgtca 1200 

ttccatcgtc tcatcttcac cagccaacga taatctatga accaggcgaa g 1251 



<210> 7 
<211> 1209 
<212> DNA 

<213> Haliotis tuberculata 



<220> 

<223> HtHl-g 



<400> 7 

atcaccatga cgaccatcag tcgggaagca tagcaggatc cggggtccgc aaggacgtga 60 

acaccttgac taaggctgag accgacaacc tgagggaggc gctgtggggt gtcatggcag 120 

accacggtcc caatggcttt caagctattg ctgctttcca tggaaaacca gctttgtgtc 180 

fcatgcctga tggccacaac tactcatgtt gtactcacgg catggctacc ttcccacact 240 

Lgcatcgcct ctacaccaag cagatggagg atgcaatgag ggcgcatggg tctcatgtcg 300 

Jsctgcccta ctgggactgg actgctgcct tcacccacct gccaacactg gtcaccgaca 360 

^gacaacaa ccccttccaa catggacaca ttgattatct caatgtcagc acaactcgat 420 

ctccccgaga catgctgttc aacgaccccg agcatggatc agagtcgttc ttctacagac 480 

aagtcctctt agctctggaa caaactgatt tctgcaaatt cgaagttcag tttgagataa 540 

cccacaatgc catccattcc tggacaggtg gccacagccc ctacggaatg tccactctcg 600 

acttcactgc ctacgatcct ctcttctggc ttcaccactc caacaccgac agaatctggg 660 

ctgtctggca agctttgcaa gaatacagag gacttccata caaccatgcc aattgtgaga 720 

tccaggcaat gaaaacgccc ctgaggcctt tcagtgacga tatcaaccac aacccagtca 780 

caaaggctaa cgcgaagcca ttagatgtgt tcgagtataa tcggttgagc ttccagtacg 840 

acaacctcat cttccatgga tacagtattc cggaacttga tcgcgtgctt gaagaaagaa 900 

aggaggagga cagaatattt gctgccttcc ttctcagtgg aatcaagcgt agtgctgatg 960 

tagtgttcga catatgccag ccagaacacg aatgtgtgtt cgcagggact tttgcgattt 1020 

tgggagggga gctagaaatg ccctggtcct tcgacagact gttccgctat gatatcacca 1080 

aggtgatgaa gcagctacac ctgaggcatg actctgactt taccttcagg gtgaagattg 1140 

tcggcaccga cgaccacgag cttccttcag acagtgtcaa agcaccaact attgaatttg 1200 
aaccgggcg 1209 

<?10> 8 — — 

<211> 1535 
<212> DNA 
k<213> Haliotis tuberculata 

Jh20> 

F<223> HtHl-h 



<400> 8 

tgcacagagg cggaaaccac gaagatgaac 
tcaggaaaga agttgacttc ctctccctgc 
acaagctcca gaatgacgac agtaaagggg 
atcctaatat gtgtccagaa agaggtaccg 
ccgtgttccc ccactggcac cgcctgcata 
atggctctcc aatgggcatt ccttactggg 
ctttctttgg agattccagc aacaacaacc 
agcacgaaac aaccagggac attaatcaga 
ttgattacct atattaccta actctgcaag 
aagttcagta tgagatcctc cataacgccg 
attccatgtc taccctggag cattcggcct 
gtttggatag aatctggatc ctttggcaga 
acgcattgga ttgtgctggc gacagactta 
aaaccgttaa tgaagatgaa ttcacccgca 
actacaggtt caactatgaa tacgataaca 
ttgaagaggt aattcaggaa ttaagaaaca 
cgggcttacg gatatcagct acagtgaaag 



accatgatga cagactcgca gatgtcctga 60 
aagaggccaa cgcaattaag gatgcactgt 120 
gctttgaggc catagctggc tatcacgggt 180 
acaagtatcc ctgctgtgtc cacggaatgc 240 
ccattcagat ggagagagct ctgaaaaacc 300 
attggacaaa gaagatgtcg agtcttccat 360 
ctttctacaa atattacatc cggggcgtgc 420 
gactctttaa tcaaaccaag tttggtgaat 480 
tcctggagga aaactcgtac tgtgactttg 540 
tccactcctg gcttggagga actggaaagt 600 
ttgaccctgt cttcatgatt caccactcga 660 
agttgcaaaa gataagaatg aagccttact 720 
tgaaagaccc cctgcatccc ttcaactacg 780 
tcaactcttt cccaagcata ctgtttgacc 840 
tgagaatcag gggtcaggac atacatgaac 900 
aagatcgcat atttgctggt tttgttttgt 960 
tattcattca ttcgaaaaac gatacaagtc 1020 



acgaagaata tgcaggagaa tttgcagttt tgggaggtga gaaggagatg ccgtgggcat 1080 

atgaaagaat gctgaaattg gacatctccg atgctgtaca caagcttcac gtgaaagatg 1140 

aagacatccg ttttagagtg gttgttactg cctacaacgg tgacgttgtt accaccaggc 1200 

tgtctcagcc attcatcgtc caccgtccag cccatgtggc tcacgacatc ttggtaatcc 1260 

cagtaggtgc gggccatgac cttccgccta aagtcgtagt aaagagcggc accaaagtcg 1320 

agtttacacc aatagattcg tcggtgaaca aagcaatggt ggagctgggc agctatactg 1380 

ctatggctaa atgcatcgtt ccccctttct cttaccacgg ctttgaactg gacaaagtct 1440 

acagcgtcga tcacggagac tactacattg ctgcaggtac ccacgcgttg tgtgagcaga 1500 

acctcaggct ccacatccac gtggaacacg agtag 1535 

<210> 9 
<211> 1003 
<212> DNA 

<213> Haliotis tuberculata 

<220> 

<223> HtH2-b 
<400> 9 

cacagactgt tcgtcaccca ggtggaagat gctctgatca ggcgaggatc gcctataggg 60 
gtcccctact gggactggac tcagcctatg gcgcatctcc caggacttgc agacaacgcc 120 
^cctatagag atcccatcag cggggacagc agacacaacc ccttccacga tgttgaagtt 180 
tcctttgaaa atggacgtac agaacgtcac ccagatagta gattgtttga acaaccttta 240 
Ittggcaaac atacgcgtct cttcgacagt atagtctatg cttttgagca ggaggacttc 300 
„"gcgattttg aagttcaatt tgagatgacc cataataata ttcacgcctg gattggtggc 360 
ggcgagaagt attccatgtc ttctctacac tacacagcct tcgaccctat cttctacctt 420 
cgtcactcca acactgaccg gctctgggca atttggcaag cgttgcagat acgaagaaac 480 
aggccttaca aggctcattg tgcttggtct gaggaacgcc agcctctcaa acctttcgcc 54 0 
ttcagttccc cactgaacaa caacgaaaaa acctacgaaa actcggtgcc caccaacgtt 600 
tacgactacg aaggagtcct tggctatact tatgatgacc tcaacttcgg gggcatggac 660 
ctgggtcagc ttgaggaata catccagagg cagagacaga gagacaggac ctttgctggt 72 0 
ttctttctgt cacatattgg tacatcagcg aatgttgaaa tcattataga ccatgggact 780 
cttcatacct ccgtgggcac gtttgctgtt cttggcggag agaaggagat gaaatgggga 840 
tttgaccgtt tgtacaaata tgagattaca gatgaactga ggcaacttaa tctccgtgct 900 
gatgatgttt tcagcatctc tgttaaagta actgatgttg atggcagtga gctgtcctct 960 
gaactcatcc catctgctgc tatcatcttc gaacgaagcc ata 1003 

<210> 10 

<211> 1251 

<212> DNA 

<r?T3> Ha HnHs Hihsrnulata — 

<220> 
k<223> HtH2-c 

,Jc400> 10 

'ttgaccatca ggacccgcat catgacacaa tcattaggaa aaatgttgat aatcttacac 60 
ccgaggaaat taattctctg aggcgggcaa tggcagacct tcaatcagac aaaaccgccg 120 
gtggattcca gcaaattgct gcttttcacg gggaacccaa atggtgccca agtcccgatg 180 
ctgagaagaa gttctcctgc tgtgtccatg gaatggctgt cttccctcac tggcacagac 240 
tcctgaccgt gcaaggcgag aatgccctga gaaagcatgg atgtctcgga gctctcccct 300 
actgggactg gactcggccc ctgtctcacc tacctgattt ggttttggta agtagcagaa 360 
ctacaccgat gccatattcc accgtggaag cccgaaaccc ctggtacagc ggccatattg 420 
atacagttgg tgttgacaca acaagaagcg tccgtcaaga actgtatgaa gctcctggat 480 
ttggccatta tactggggtc gctaagcaag tgcttctggc tttggagcag gatgacttct 540 
gtgattttga agtccagttt gagatagctc acaatttcat tcacgctctt gtcggcggaa 600 
gcgagccata tggtatggcg tcactccgtt acactactta tgatccaatt ttctacctcc 660 
atcattctaa cactgacaga ctctgggcta tatggcaggc tctacaaaag tacaggggca 720 
aaccttacaa ttccgccaac tgcgccattg cttctatgag aaaaccccta caaccctttg 780 
gtctgactga tgagatcaac ccggatgatg agacaagaca gcatgctgtt cctttcagtg 840 
tctttgatta caagaacaac ttcaattatg aatatgacac ccttgacttc aacggactat 900 
caatctccca gctggaccgt gaactgtcac ggagaaagtc tcatgacaga gtatttgccg 960 
gatttttgct gcatggtatt cagcagtctg cactagttaa attctttgtc tgcaaatcag 1020 
atgatgactg tgaccactat gctggtgaat tctacatcct tggtgatgaa gctgaaatgc 108 0 
catggggcta tgatcgtctt tacaaatatg agatcactga gcagctcaat gccctggatc 1140 
tacacatcgg agatagattc ttcatcagat acgaagcgtt tgatcttcat ggtacaagtc 1200 
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ttggaagcaa catc cc aaaccttctg tcatacatga cgaa^Pggca g 1251 

<210> 11 
<211> 1244 
<212> DNA 

<213> Haliotis tuberculata 
<220> 

<223> HtH2-d 
<400> 11 

gtcaccatca ggctgacgag tacgacgaag ttgtaactgc tgcaagccac atcagaaaga 60 

atttaaaaga tctgtcaaag ggagaagtag agagcctaag gtctgccttc ctgcaacttc 120 

agaacgacgg agtctatgag aatattgcca agttccacgg caagcctggg ttgtgtgatg 180 

ataacggtcg caaggttgcc tgttgtgtcc atggaatgcc caccttcccc cagtggcaca 240 

ggctctatgt cctccaggtg gagaatgctt tgctggagag aggatctgcc gtctctgtgc 300 

catactggga ctggactgaa acatttacag agctgccatc tttgattgct gaggctacct 360 

atttcaattc ccgtcaacaa acgtttgacc ctaatccttt cttcagaggt aaaatcagtt 420 

ttgagaatgc tgttacaaca cgtgatcccc agcctgagct gtacgttaac aggtactact 480 

accaaaacgt catgttggtt tttgaacagg acaactactg cgacttcgag atacagtttg 54 0 

agatggttca caatgttctc catgcttggc ttggtggaag agctacttat tctatttctt 600 

ctcttgatta ttctgcattc gaccctgtgt ttttccttca ccatgcgaac acagatagat 660 

gtgggccat ctggcaggag ctgcagaggt acaggaagaa gccatacaat gaagcggatt 720 

tgccattaa cctaatgcgc aaacctctac atcccttcga caacagtgat ctcaatcatg 780 

tcctgtaac ctttaaatac tcaaaaccca ctgatggctt tgactaccag aacaactttg 840 

gatacaagta tgacaacctt gagttcaatc atttcagtat tcccaggctt gaagaaatca 900 

ttcgtattag acaacgtcaa gatcgtgtgt ttgcaggatt cctccttcac aacattggga 960 

catccgcaac tgttgagata ttcgtctgtg tccctaccac cagcggtgag caaaactgtg 1020 

aaaacaaagc cggaacattt gccgtactcg gaggagaaac agagatggcg tttcattttg 1080 

acagactcta caggtttgac atcagtgaaa cactgaggga cctcggcata cagctggaca 1140 

gccatgactt tgacctcagc atcaagattc aaggagtaaa tggatcctac cttgatccac 1200 

acatcctgcc agagccatcc ttgatttttg tgcctggttc aagt 1244 

<210> 12 
<211> 1255 
<212> DNA 

<213> Haliotis tuberculata 
<220> 

<223> HtH2-e 
<400> 12 

tctttcctgc gtcctgatgg gcattcagat gacatccttg tgagaaaaga agtgaacagc 60 

kctgacaacca gggagactgc atctctgatc catgctctga aaagtatgca ggaagaccat 120 

Jicacctgacg ggttccaagc cattgcctct ttccatgctc tgccaccact ctgcccttca 180 

jfccatctgcag ctcaccgtta tgcttgctgt gtccacggca tggctacatt tccccagtgg 240 

- cacagattgt acactgtaca gttccaggat gcactgagga gacatggagc tacggtaggt 300 

gtaccgtatt gggattggct gcgaccgcag tctcacctac cagagcttgt caccatggag 360 

acataccatg atatttggag taacagagat ttccccaatc ctttctacca agccaatatt 420 

gagtttgaag gagaaaacat tacaacagag agagaagtca ttgcagacaa actttttgtc 480 

aaaggtggac acgtttttga taaactggtt cttcaaacaa gccatcctag cgctgagcag 540 

gaaaactact gtgactttga gattcagttt gaaattcttc acaacggcgt tcacacgtgg 600 

gtcggaggca gtcgtaccta ctctatcgga catcttcatt acgcattcta cgaccctctt 660 

ttctaccttc accatttcca gacagaccgt atttgggcaa tctggcaaga actccaggaa 720 

cagagagggc tctcgggtga tgaggctcac tgtgctctcg agcaaatgag agaaccattg 780 

aagcctttca gcttcggcgc tccttataac tggaatcagc tcacacagga tttctcccga 840 

cccgaggaca ccttcgacta caggaagttt ggttatgaat atgacaattt agaattcctg 900 

ggaatgtcag ttgctgaact ggatcaatac attattgaac atcaagaaaa tgatagagta 960 

ttcgctgggt tcctgttgag tggattcgga ggttccgcat cagttaattt ccaggtttgt 1020 

agagctgatt ccacatgtca ggatgctggg tacttcaccg ttcttggtgg cagtgctgag 1080 

atggcgtggg catttgacag gctttacaaa tatgacatta ctgaaactct ggagaaaatg 1140 

caccttcgat atgatgatga cttcacaatc tctgtcagtc tgaccgccaa caacggaact 1200 

gtcctgagca gcagtctaat cccaacaccg agtgtcatat tccagcgggg acatc 1255 



<210> 13 
<211> 1248 



<212> DNA 

<213> Haliotis tuberculata 
<220> 

<223> HtH2-f 
<400> 13 

gtgacataaa taccaggagc atgtcaccga accgtgttcg ccgtgagctg agcgatctgt 60 
ctgcgaggga cctgtctagt ctcaagtctg ctctgcgaga cctacaggag gatgatggcc 120 
ccaacggata ccaggctctt gcagccttcc atgggctacc agcaggctgc catgatagcc 180 
ggggaaatga gatcgcatgt tgcattcacg ggatgccgac cttcccccag tggcacagac 240 
tgtacaccct gcagttggag atggctctga ggagacatgg atcatctgtc gccatcccct 300 
actgggactg gacaaagcct atctccgaac tcccctcgct cttcaccagc cctgagtatt 360 
atgacccatg gcatgatgct gtggtaaaca acccattctc caaaggtttt gtcaaatttg 420 
caaataccta cacagtaaga gacccacagg agatgctgtt ccagctttgt gaacatggag 480 
agtcaatcct ctatgagcaa actcttcttg ctcttgagca aaccgactac tgtgattttg 540 
aggtacagtt tgaggtcctc cataacgtga tccactacct tgttggtgga cgtcagacct 600 
acgcattgtc ttctctgcat tatgcctcct acgacccatt cttctttata caccattcct 660 
ttgtggataa gatgtgggta gtatggcaag ctcttcaaaa gaggaggaaa cttccataca 720 
agcgagctga ctgtgctgtc aacctaatga ctaaaccaat gaggccattt gactccgata 780 
tgaatcagaa cccattcaca aagatgcacg cagttcccaa cacactctat gactacgaga 840 
actgtacta cagctacgat aatctcgaaa taggtggcag gaatctcgac cagcttcagg 900 
ktgaaattga cagaagcaga agccacgatc gcgtttttgc tggattcttg cttcgtggaa 960 
Icggaacttc tgctgatgtc aggttttgga tttgtagaaa tgaaaatgac tgccacaggg 1020 
Krtggaataat tttcatctta ggtggagcca aggaaatgcc atggtcattt gacagaaact 1080 
tcaagtttga tatcacccat gtactcgaga atgctggcat tagcccagag gacgtgtttg 1140 
atgctgagga gccattttat atcaaggttg agatccatgc tgttaacaag accatgatac 1200 
cgtcgtctgt gatcccagcc ccaactatca tctattctcc tggggaag 1248 

<210> 14 
<211> 1207 
<212> DNA 

<213> Haliotis tuberculata 

<220> 

<223> HtH2-g 
<400> 14 

gtcgcgctgc tgacagtgcg cactctgcca acattgctgg ctctggggtg aggaaggacg 60 
tcacgaccct cactgtgtct gagaccgaga acctaagaca ggctcttcaa ggtgtcatcg 120 
at-gal-ari-gg tr.r.r.aatqqt t-arraagr.aa hagr.at-.r.ntf. r.i-janggaagt: nntccaat.qt IRQ 
gcgagatgaa cggccgcaag gttgcctgtt gtgctcacgg tatggcctcc ttcccacact 240 
ggcacagact gtatgtgaag cagatggaag atgccctggc tgaccacggg tcacatatcg 300 
wgcatccctta ctgggactgg acaactgcct tcacagagtt acccgccctt gtcacagact 360 
Tccgagaacaa tcccttccat gagggtcgca ttgatcatct cggtgtaacc acgtcacgtt 420 
j^cccccagaga catgctgttt aacgacccag agcaaggatc agagtcgttc ttctatagac 480 
aagtcctcct ggctttggag cagactgact actgccagtt cgaagtccag tttgagctga 540 
cccacaacgc cattcactcc tggacaggtg gacgtagccc ttacggaatg tcgaccctcg 600 
agttcacagc ctacgatcct ctcttctggc ttcaccactc caacaccgac agaatctggg 660 
ctgtctggca agcactgcag aaataccgag gactcccata caacgaagca cactgtgaaa 720 
tccaggttct gaaacagccc ttgaggccat tcaacgatga catcaaccac aatccaatca 780 
ccaagactaa tgccaggcct atcgattcat ttgattatga gaggtttaac tatcagtatg 840 
acacccttag cttccatggt aagagcatcc ctgaactgaa tgacctgctc gaggaaagaa 900 
aaagagaaga gagaacattt gctgccttcc ttcttcgtgg aatcggttgc agtgctgatg 960 
tcgtctttga catctgccgg cccaatggtg actgtgtctt tgcaggaacc tttgctgtgc 1020 
tgggagggga gctagaaatg ccttggtcct tcgacagact gttccgctat gacatcacca 1080 
gagtcatgaa tcagctccat ctccagtatg attcagattt cagtttcagg gtgaagcttg 1140 
ttgccaccaa tggcactgag ctttcatcag accttctcaa gtcaccaaca attgaacatg 1200 
aacttgg 1207 

<210> 15 
<211> 1546 
<212> DNA 

<213> Haliotis tuberculata 



<220> 



<223> HtH2-h 



39 



w 



<400> 15 

agcccacaga ggaccagttg aagaaacaga agtcactcgc caacatactg acggcaatgc 60 

acactttcat cgtaaggaag ttgattcgct gtccctggat gaagcaaaca acttgaagaa 120 

tgccctttac aagctacaga acgaccacag tctaacggga tacgaagcaa tctctggtta 180 

ccatggatac cccaatctgt gtccggaaga aggcgatgac aaaatacccc tgctgcgtcc 240 

ccggatgggc atctttcctt actggcacag actcttgacc attcaactgg aaagagctct 300 

tgagcacaat ggtgcactgc ttggtgttcc ttactgggac tggaacaagg acctgtcgtc 360 

actgccggcg ttcttctccg actccagcaa caacaatccc tacttcaagt accacatcgc 420 

cggtgttggt cacgacaccg tcagagagcc aactagtctt atatataacc agccccaaat 480 

ccatggttat gattatctct attacctagc attgaccacg cttgaagaaa acaattactg 540 

ggactttgag gttcagtatg agatcctcca caacgccgtc cactcctggc ttggaggatc 600 

ccagaagtat tccatgtcta ccctggagta ttcggccttt gaccctgtct ttatgatcct 660 

tcactcgggt ctagacagac tttggatcat ctggcaagaa cttcagaaga tcaggagaaa 720 

gccctacaac ttcgctaaat gtgcttatca tatgatggaa gagccactgg cgcccttcag 780 

ctatccatct atcaaccagg acgagttcac ccgtgccaac tccaagcctt ctacagtttt 840 

tgacagccat aagttcggct accattacga taacctgaat gttagaggtc acagcatcca 900 

agaactcaac acaatcatca atgacttgag aaacacagac agaatctacg caggatttgt 960 

tttgtcaggc atcggtacgt ctgctagtgt caagatctat ctccgaacag atgacaatga 1020 

cgaagaagtt ggaactttca ctgtcctggg aggagagagg gaaatgccat gggcctacga 1080 

icgagttttc aagtatgaca tcacagaggt tgcagataga cttaaaatta agttatgggg 1140 

icacccttta acttccggaa ctggagatca catccttacg aatggaatcg gtggtaaaca 1200 

Igagcctacc caaatccttt catcatctac agacctgcca atcatgacta cgatgttctt 1260 

a ttatcccag tanggaagaa accttcacat ccctcccaaa gttgtcgtca agaaaggcac 1320 

ccgcatcgag ttccacccag tcgatgattc agttacgaga ccagttgttg atcttggaag 13 8 0 

ctacactgca ctcttcaact gtgtggtacc accgttcaca taccacggat tcgaactgaa 1440 

ccacgtctat tctgtcaagc ctggtgacta ctatgttact ggacccacga gagacctttg 1500 

ccagaatgca gatgtcagga ttcatatcca tgttgaggat gagtaa 154 6 



<210> 16 
<211> 967 
<212> DNA 

<213> Megathura crenulata 



<220> 

<223> KLHl-b 



<400> 16 

ggcctaccgt actgggactg gactgaaccc atgacacaca ttccgggtct ggcaggaaac 60 

aaaacttatg tggattctaa tggtgcafrcc eacacaaati? cfcfcfcfccafcag fct-eagtgafct 1?" 

gcatttgaag aaaatgctcc ccacaccaaa agacaaatag atcaaagact ctttaaaccc 18 0 

gctacctttg gacaccacac agacctgttc aaccagattt tgtatgcctt tgaacaagaa 240 

•gattactgtg actttgaagt ccaatttgag attacccata acacgattca cgcttggaca 300 

bgaggaagcg aacatttctc aatgtcgtcc ctacattaca cagctttcga tcctttgttt 360 

tactttcacc attctaacgt tgatcgtctt tgggccgttt ggcaagcctt acagatgaga 420 

cggcataaac cctacagggc ccactgcgcc atatctctgg aacatatgca tctgaaacca 480 

ttcgcctttt catctcccct taacaataac gaaaagactc atgccaatgc catgccaaac 54 0 

aagatctacg actatgaaaa tgtcctccat tacacatacg aagatttaac atttggaggc 600 

atctctctgg aaaacataga aaagatgatc cacgaaaacc agcaagaaga cagaatatat 660 

gccggttttc tcctggctgg catacgtact tcagcaaatg ttgatatctt cattaaaact 720 

accgattccg tgcaacataa ggctggaaca tttgcagtgc tcggtggaag caaggaaatg 780 

aagtggggat ttgatcgcgt tttcaagttt gacatcacgc acgttttgaa agatctcgat 840 

ctcactgctg atggcgattt cgaagttact gttgacatca ctgaagtcga tggaactaaa 900 

cttacatcca gtcttattcc acatgcttct gtcattcgtg agcatgcacg tggtaagctg 960 
= „ 967 
aatagag 

<210> 17 
<211> 1242 
<212> DNA 

<213> Megathura crenulata 



<220> 

<223> KLHl-c 



<400> 17 



40 



ttaaatttga caaagtgcca aggagtcgtc ttattcgaaa aaatgtagac cgtttgagcc 60 

ccgaggagat gaatgaactt cgtaaagccc tagccttact gaaagaggac aaaagtgccg 120 

gtggatttca gcagcttggt gcattccatg gggagccaaa atggtgtcct agtcccgaag 180 

catctaaaaa atttgcctgc tgtgttcacg gcatgtctgt gttccctcac tggcatcgac 240 

tgttgacggt tcagagtgaa aatgctttga gacgacatgg ctacgatgga gctttgccgt 300 

actgggattg gacctctcct cttaatcacc ttcccgaact ggcagatcat gagaagtacg 360 

tcgaccctga agatggggta gagaagcata acccttggtt cgatggtcat atagatacag 420 

tcgacaaaac aacaacaaga agtgttcaga ataaactctt cgaacagcct gagtttggtc 480 

attatacaag cattgccaaa caagtactgc tagcgttgga acaggacaat ttctgtgact 540 

ttgaaatcca atatgagatt gcccataact acatccatgc acttgtagga ggcgctcagc 600 

cttatggtat ggcatcgctt cgctacactg cttttgatcc actattctac ttgcatcact 660 

ctaatacaga tcgtatatgg gcaatatggc aggctttaca gaagtacaga ggaaaaccgt 720 

acaacgttgc taactgtgct gttacatcga tgagagaacc tttgcaacca tttggcctct 780 

ctgccaatat caacacagac catgtaacca aggagcattc agtgccattc aacgtttttg 840 

attacaagac caatttcaat tatgaatatg acactttgga atttaacggt ctctcaatct 900 

ctcagttgaa taaaaagctc gaagcgataa agagccaaga caggttcttt gcaggcttcc 960 

tgttatctgg tttcaagaaa tcatctcttg ttaaattcaa tatttgcacc gatagcagca 1020 

actgtcaccc cgctggagag ttttaccttc tgggtgatga aaacgagatg ccatgggcat 1080 

acgatagagt cttcaaatat gacataaccg aaaaactcca cgatctaaag ctgcatgcag 1140 

aagaccactt ctacattgac tatgaagtat ttgaccttaa accagcaagc ctgggaaaag 1200 

atttgttcaa gcagccttca gtcattcatg aaccaagaat ag 1242 

•210> 18 
211> 1236 
212> DNA 
<213> Megathura crenulata 

<220> 

<223> KLHl-d 
<400> 18 

gtcaccatga aggcgaagta tatcaagctg aagtaacttc tgccaaccgt attcgaaaaa 60 

acattgaaaa tctgagcctt ggtgaactcg aaagtctgag agctgccttc ctggaaattg 120 

aaaacgatgg aacttacgaa tcaatagcta aattccatgg tagccctggt ttgtgccagt 180 

taaatggtaa ccccatctct tgttgtgtcc atggcatgcc aactttccct cactggcaca 240 

gactgtacgt ggttgtcgtt gagaatgccc tcctgaaaaa aggatcatct gtagctgttc 300 

cctattggga ctggacaaaa cgaatcgaac atttacctca cctgatttca gacgccactt 360 

actacaattc caggcaacat cactatgaga caaacccatt ccatcatggc aaaatcacac 420 

acgagaatga aatcactact agggatccca aggacagcct cttccattca gactactttt 480 

acgagcaggt cctttacgcc ttggagcagg ataacttctg tgatttcgag attcagttgg 540 

agatattaoa caatgcattg cattctttac ttggfggr-aa riggtaaatat trratqtraa fifif) 

accttgatta cgctgctttt gatcctgtgt tcttccttca tcacgcaacg actgacagaa 660 

tctgggcaat ctggcaagac cttcagaggt tccgaaaacg gccataccga gaagcgaatt 720 

•gcgctatcca attgatgcac acgccactcc agccgtttga taagagcgac aacaatgacg 780 

aggcaacgaa aacgcatgcc actccacatg atggttttga atatcaaaac agctttggtt 840 

atgcttacga taatctggaa ctgaatcact actcgattcc tcagcttgat cacatgctgc 900 

aagaaagaaa aaggcatgac agagtattcg ctggcttcct ccttcacaat attggaacat 960 

ctgccgatgg ccatgtattt gtatgtctcc caactgggga acacacgaag gactgcagtc 1020 

atgaggctgg tatgttctcc atcttaggcg gtcaaacgga gatgtccttt gtatttgaca 1080 

gactttacaa acttgacata actaaagcct tgaaaaagaa cggtgtgcac ctgcaagggg 1140 

atttcgatct ggaaattgag attacggctg tgaatggatc tcatctagac agtcatgtca 1200 

tccactctcc cactatactg tttgaggccg gaacag 1236 

<210> 19 
<211> 241 
<212> DNA 

<213> Megathura crenulata 
<220> 

<223> KLHl-e 
<400> 19 

attctgccca cacagatgat ggacacactg aaccagtgat gattcgcaaa gatatcacac 60 

aattggacaa gcgtcaacaa ctgtcactgg tgaaagccct cgagtccatg aaagccgacc 120 

attcatctga tgggttccag gcaatcgctt ccttccatgc tcttcctcct ctttgtccat 180 

caccagctgc ttcaaagagg tttgcgtgct gcgtccatgg catgccaacc ttcccgcaat 240 



41 



g 

<210> 20 
<211> 949 
<212> DNA 

<213> Megathura crenulata 

<220> 

<223> KLH2-b 
<400> 20 

ggcctgccct actgggattg gaccatgcca 
gagacctacc tcgatccagt tactggggaa 
gtggcgtttg aaaatggtgt aacaagcagg 
acttacggag accacactta cctcttcgac 
ttctgcgact ttgaagtcca atatgagctc 
ggcagtgaaa agtattcaat gtcttctctt 
ctccatcact caaatgttga tcgtctctgg 
ggcaagtctt acaaggccca ctgcgcctcg 
gcattcagtt ccccactgaa caacaacgag 
gtttatgact atgtgggagt tttgcactat 

•accatgtcag aacttgagga atatattcac 
kgattcttcc tttcatatat tggaacatca 
Igtcatgata aatacaaagt gggaagtttt 
tggggctttg atagaatgta caagtatgag 
gcagtggatg atgggttcag cattactgtt 
tctgcagatc tcattccacc tcctgctata 




241 



atgagtcatt tgccagaact ggctacaagt 60 
actaaaaaca accctttcca tcacgcccaa 120 
aatcctgatg ccaaactttt tatgaaacca 180 
agcatgatct acgcatttga gcaggaagac 240 
acgcataatg caatacatgc atgggttgga 300 
cactacactg cttttgatcc tatattttac 360 
gccatttggc aagctcttca aatcaggaga 420 
tctcaagaaa gagaaccatt aaagcctttt 480 
aaaacgtacc acaactctgt ccccactaac 540 
cgatatgatg accttcagtt tggcggtatg 600 
aagcagacac aacatgatag aacctttgca 660 
gcaagcgtag atatcttcat caatcgagaa 720 
gtagtacttg gtggatccaa agaaatgaaa 780 
atcactgagg ctctgaagac gctgaatgtt 840 
gagatcaccg atgttgatgg atctccccca 900 
atctttgaac gtggtcatg 949 



<210> 21 
<211> 760 
<212> DNA 

<213> Megathura crenulata 

<220> 

<223> KLH2-C 
<400> 21 

ctgatgccaa agactttggc catagcagaa aaatcaggaa agccgttgat tctctgacag 60 

tcgaagaaca aacttcgttg aggcgagcta tggcagatct acaggacgac aaaacatcag 120 

ggggttteca gcagattgca gcattccacg gagaaccaaa atggtgteea a g ceaegaag 100 — 

cggagaaaaa atttgcatgc tgtgttcatg gaatggctgt tttccctcac tggcacagat 240 

tgctgacagt tcaaggagaa aatgctctga ggaaacatgg ctttactggt ggactgccct 300 

kactgggactg gactcgatca atgagcgccc ttccacattt tgttgctgat cctacttaca 360 

^tgatgctat ttccagccag gaagaagata acccatggca tcatggtcac atagactctg 420 

Fttgggcatga tactacaaga gatgtgcgtg atgatcttta tcaatctcct ggtttcggtc 480 

actacacaga tattgcacaa caagtccttc tggcctttga gcaggacagt ttctgtgatt 540 

ttgaggtaca atttgaaatt gcccataatt tcatacatgc actgattggt ggtaacgaac 600 

catacagtat gtcatctttg aggtatacta catacgatcc aatcttcttc ttgcaccact 660 

ccagtacaga ccgactttgg gccatctggc aagcaatcac tagtgcggcc gcctgcaggt 720 

cgaccataag ggagagctcc caacgcgttg gatgcaatct 7 60 

<210> 22 
<211> 323 
<212> DNA 

<213> Megathura crenulata 
<220> 

<223> KLH2-d 
<400> 22 

gttcacacca ggctgatgaa tatcgtgagg cagtaacaag cgctagccac ataagaaaaa 60 
atatccggga cctctcagag ggagaaattg agagcatcag atctgctttc ctccaaattc 120 
aaaaagaggg tatatatgaa aacattgcaa agttccatgg aaaaccagga ctttgtgaac 180 
atgatggaca tcctgttgct tgttgtgtcc atggcatgcc cacctttccc cactggcaca 240 
gactgtacgt tcttcaggtg gagaatgcgc tcttagaacg agggtctgca gttgctgttc 300 
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cttactggga ctggacccta cct 323 

<210> 23 
<211> 988 
<212> DNA 

<213> Megathura crenulata 
<220> 

<223> KLH2-g 
<400> 23 

atggctgtgt ttccgcactg gcacagactg tttgtgaaac agatggagga cgcacttgct 60 
gctcatggag ctcatattgg cataccatac tgggattgga caagtgcgtt tagtcatctg 120 
cccgccctag tgactgacca cgagaacaat cccttccacc acggccatat tggtcatctg 180 
aatgtggata catctcgatc tccaagagac atgctgttta atgatcctga acaaggctca 240 
gaatcattct tctacagaca ggttctcttg actctagaac agacagactt ctgccaattt 300 
gaagttcagt ttgaacttac acacaatgcc atccactctt ggactggagg acatactcca 360 
tatggaatgt catcactgga atatacagca tatgatccac tcttttatct ccaccattcc 420 
aacactgatc gtatctgggc catctggcag gcactccaga aatatagagg tcttccatac 480 
aacgcagctc actgcgatat ccaagttctg aaacaacctc ttaaaccatt cagcgagtcc 540 
aggaatccaa acccagtcac cagagccaat tctagggccg ttgattcatt tgattatgag 600 
-aaattcaatt atcaatatga cacacttacc ttccacggac tttctatccc agaacttgat 660 
jccatgcttc aagagagaaa gaaggaagag agaacatttg cagccttcct gttgcacgga 720 
Ittggcgcca gtgctgatgt ttcgtttgat gtctgcacac ctgatggtca ttgtgccttt 780 
gctggaacct tcgcggtact tggtggggag cttgagatgc cctggtcctt tgaaagattg 840 
ttccgttacg atatcacaaa ggttctcaag cagatgaatc ttcactatga ttctgagttc 900 
cactttgagt tgaagattgt tggcacagat ggaacagaac tgccatcgga tcgtatcaag 960 
agccctacca ttgaacacca tggaggag 988 

<210> 24 
<211> 310 
<212> DNA 

<213> Megathura crenulata 

<220> 

<223> KLH2-h 
<400> 24 

gtcacgatca cagtgaacgt cacgatggat ttttcaggaa ggaagtcggt tccctgtccc 60 
tggatgaagc caatgacctt aaaaatgcac tgtacaagct gcagaatgat cagggtccca 120 

nfrggnl-nt-rj . -i n t- n n n fe n <j g e <J<jf- f a r-r a 1-g gr-h a t nr-a fc£ ccfccfccpCCCr. gaaratggt g 180 

aagaccagta cgcatgctgt gtccacggaa tgcctgtatt tccacattgg cacagacttc 240 
atacaatcca gtttgagaga gctctcaaag aacatggttc tcatttgggt ctgccatact 300 
kgggactggac 310 

™<210> 25 

' <211> 422 
<212> PRT 

<213> Haliotis tuberculata 

<220> 

<221> SIGNAL 
<222> (1) . . (15) 

<220> 

<223> HtHl-a 
<400> 25 

Leu Val Gin Phe Leu Leu Val Ala Leu Val Ala Gly Ala Gly Ala Asp 
15 10 15 

Asn Val Val Arg Lys Asp Val Ser His Leu Thr Asp Asp Glu Val Gin 



Ala Leu His Gly Ala Leu His Asp Val Thr Ala Ser Thr Gly Pro Leu 
35 40 45 
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Ser Phe Glu Asp lie Thr Ser Tyr His Ala Ala Pro Ala Ser Cys Asp 
50 55 60 

Tyr Lys Gly Arg Lys lie Ala Cys Cys Val His Gly Met Pro Ser Phe 
65 70 75 80 

Pro Phe Trp His Arg Ala Tyr Val Val Gin Ala Glu Arg Ala Leu Leu 
85 90 95 

Ser Lys Arg Lys Thr Val Gly Met Pro Tyr Trp Asp Trp Thr Gin Thr 
100 105 110 

Leu Thr His Leu Pro Ser Leu Val Thr Glu Pro lie Tyr lie Asp Ser 
115 120 125 

Lys Gly Gly Lys Ala Gin Thr Asn Tyr Trp Tyr Arg Gly Glu lie Ala 
130 135 140 

Phe lie Asn Lys Lys Thr Ala Arg Ala Val Asp Asp Arg Leu Phe Glu 
145 150 155 160 

^ys Val Glu Pro Gly His Tyr Thr His Leu Met Glu Thr Val Leu Asp 
165 170 175 

Ala Leu Glu Gin Asp Glu Phe Cys Lys Phe Glu lie Gin Phe Glu Leu 
180 185 190 

Ala His Asn Ala lie His Tyr Leu Val Gly Gly Lys Phe Glu Tyr Ser 
195 200 205 

Met Ser Asn Leu Glu Tyr Thr Ser Tyr Asp Pro lie Phe Phe Leu His 
210 215 220 

His Ser Asn Val Asp Arg Leu Phe Ala lie Trp Gin Arg Leu Gin Glu 
225 230 235 240 

Leu Arg Gly Lys Asn Pro Asn Ala Met Asp Cys Ala His Glu Leu Ala 
245 250 255 



Ph e Asn Arg A sp S er Asn Pro 



kThr Lys Asp His Ser Thr Pro Ala Asp Leu Phe Asp Tyr Lys Gin Leu 

275 280 285 

Gly Tyr Ser Tyr Asp Ser Leu Asn Leu Asn Gly Met Thr Pro Glu Gin 

290 295 300 

Leu Lys Thr Glu Leu Asp Glu Arg His Ser Lys Glu Arg Ala Phe Ala 

305 310 ' 315 320 

Ser Phe Arg Leu Ser Gly Phe Gly Gly Ser Ala Asn Val Val Val Tyr 

325 330 335 

Ala Cys Val Pro Asp Asp Asp Pro Arg Ser Asp Asp Tyr Cys Glu Lys 

340 345 350 

Ala Gly Asp Phe Phe lie Leu Gly Gly Gin Ser Glu Met Pro Trp Arg 

355 360 365 

Phe Tyr Arg Pro Phe Phe Tyr Asp Val Thr Glu Ala Val His His Leu 

370 375 380 

Gly Val Pro Leu Ser Gly His Tyr Tyr Val Lys Thr Glu Leu Phe Ser 

385 390 395 400 



44 



Val Asn Gly Thr Ala Leu Ser Pro Asp Leu Leu Pro Gin Pro Thr Val 
405 410 415 

Ala Tyr Arg Pro Gly Lys 
420 



<210> 26 
<211> 419 
<212> PRT 

<213> Haliotis tuberculata 



<220> 

<223> HtHl-b 
<400> 26 

Gly His Leu Asp Pro Pro Val His His Arg His Asp Asp Asp Leu lie 
1 5 10 15 

Val Arg Lys Asn lie Asp His Leu Thr Arg Glu Glu Glu Tyr Glu Leu 
20 25 30 

Irg Met Ala Leu Glu Arg Phe Gin Ala Asp Thr Ser Val Asp Gly Tyr 
35 40 45 

Gin Ala Thr Val Glu Tyr His Gly Leu Pro Ala Arg Cys Pro Arg Pro 
50 55 60 

Asp Ala Lys Val Arg Phe Ala Cys Cys Met His Gly Met Ala Ser Phe 
65 70 75 80 

Pro His Trp His Arg Leu Phe Val Thr Gin Val Glu Asp Ala Leu Val 
85 90 95 

Arg Arg Gly Ser Pro lie Gly Val Pro Tyr Trp Asp Trp Thr Lys Pro 
100 105 * 110 

Met Thr His Leu Pro Asp Leu Ala Ser Asn Glu Thr Tyr Val Asp Pro 
115 120 125 

Tyr Gly His Thr His His Asn Pro Phe Phe Asn Ala Asn lie Ser Phe 
130 135 140 



llu Glu Gly His His His Thr Ser Arg Met lie Asp Ser Lys Leu Phe 
'145 150 155 160 

Ala Pro Val Ala Phe Gly Glu His Ser His Leu Phe Asp Gly He Leu 
165 170 175 

Tyr Ala Phe Glu Gin Glu Asp Phe Cys Asp Phe Glu lie Gin Phe Glu 
180 185 * 190 

Leu Val His Asn Ser lie His Ala Trp He Gly Gly Ser Glu Asp Tyr 
195 200 205 

Ser Met Ala Thr Leu His Tyr Thr Ala Phe Asp Pro He Phe Tyr Leu 
210 215 220 

His His Ser Asn Val Asp Arg Leu Trp Ala He Trp Gin Ala Leu Gin 
225 230 235 240 

He Arg Arg His Lys Pro Tyr Gin Ala His Cys Ala Gin Ser Val Glu 
245 250 255 



Gin Leu Pro Met Lys Pro Phe Ala Phe Pro Ser Pro Leu Asn Asn Asn 



45 



Glu Lys Thr His Ser His Ser Val Pro Thr Asp lie Tyr Asp Tyr Glu 
275 280 285 

Glu Val Leu His Tyr Ser Tyr Asp Asp Leu Thr Phe Gly Gly Met Asn 
290 295 300 

Leu Glu Glu lie Glu Glu Ala lie His Leu Arg Gin Gin His Glu Arg 
305 310 315 320 

Val Phe Ala Gly Phe Leu Leu Ala Gly He Gly Thr Ser Ala Leu Val 
325 330 335 

Asp He Phe He Asn Lys Pro Gly Asn Gin Pro Leu Lys Ala Gly Asp 
340 345 350 

He Ala He Leu Gly Gly Ala Lys Glu Met Pro Trp Ala Phe Asp Arg 
355 360 365 

Leu Tyr Lys Val Glu He Thr Asp Ser Leu Lys Thr Leu Ser Leu Asp 
370 375 380 

•al Asp Gly Asp Tyr Glu Val Thr Phe Lys He His Asp Met His Gly 

390 395 400 

Asn Ala Leu Asp Thr Asp Leu He Pro His Ala Ala Val Val Ser Glu 
405 410 415 

Pro Ala His 



<210> 27 
<211> 414 
<212> PRT 
<213> Haliotis 



tuberculata 



<220> 

<223> HtHl-c 



<400> 27 

Pro Thr Phe Glu Asp Glu Lys 
5 

^Asp Ser Leu Thr Pro Glu Glu 

20 

Leu Leu Glu Asn Asp His Thr 
Pro Lys Trp 



35 



Phe His Gly Glu 
50 

Val Ala Cys Cys 
65 



55 



Val His Gly ] 
70 



His Ser Leu Arg 
10 

Thr Asn Glu Leu 

25 

Ala Gly Gly Phe 
40 

Cys Pro Asn Pro 



Ala Leu Glu 



lie Arg Lys Asn Val 

Arg Lys 

Asn Gin 
45 

Glu Ala 



Ala Val Phe 
75 



Leu Gly Ala 
Glu His Lys 
Pro His Trp His Arg 



60 



Leu Leu Ala Leu Gin Ala Glu 
85 

Tyr Trp Asp 
His Glu Gin 



Ala Leu Arg 
90 



Lys His 



Gly Tyr Ser 
95 



Gly Ala Leu Pro 
100 



Thr Arg Pro 
105 



Gin Leu Pro 
110 



Asp Leu Val Ser 
115 



Tyr Thr Asp Pro 
120 



Ser Asp 
125 



His His Val 



46 



Lys His Asn Pro Trp Phe Asn Gly His He Asp Thr Val Asn Gin Asp 
130 135 140 

Thr Thr Arg Ser Val Arg Glu Asp Leu Tyr Gin Gin Pro Glu Phe Gly 
145 150 155 160 

His Phe Thr Asp He Ala Gin Gin Val Leu Leu Ala Leu Glu Gin Asp 
165 I 70 

Asp Phe Cys Ser Phe Glu Val Gin Tyr Glu He Ser His Asn Phe He 
180 I 85 I 90 

His Ala Leu Val Gly Gly Thr Asp Ala Tyr Gly Met Ala Ser Leu Arg 
195 200 205 

Tyr Thr Ala Tyr Asp Pro He Phe Phe Leu His His Ser Asn Thr Asp 
210 215 220 

Arg He Trp Ala He Trp Gin Ser Leu Gin Lys Tyr Arg Gly Lys Pro 
225 230 235 240 

^Tyr Asn Thr Ala Asn Cys Ala He Glu Ser Met Arg Arg Pro Leu Gin 
^ 245 250 

fro Phe Gly Leu Ser Ser Ala He Asn Pro Asp Arg He Thr Arg Glu 

260 265 270 

His Ala lie Pro Phe Asp Val Phe Asn Tyr Arg Asp Asn Leu His Tyr 
275 280 285 

Val Tyr Asp Thr Leu Glu Phe Asn Gly Leu Ser lie Ser Gin Leu Asp 

290 295 300 

Arg Glu Leu Glu Lys lie Lys Ser His Glu Arg Val Phe Ala Gly Phe 
305 310 315 

Leu Leu Ser Gly He Lys Lys Ser Ala Leu Val Lys Phe Glu Val Cys 
325 330 

Thr Pro Pro Asp Asn Cys His Lys Ala Gly Glu Phe Tyr Leu Leu Gly 

Asp Glu Asn Glu Met Ala Trp Ala Tyr Asp Arg Leu Phe Lys Tyr Asp 
- 355 360 365 

lie Thr Gin Val Leu Glu Ala Asn His Leu His Phe Tyr Asp His Leu 

370 375 380 

Phe lie Arg Tyr Glu Val Phe Asp Leu Lys Gly Val Ser Leu Gly Thr 
385 390 395 

Asp Leu Phe His Thr Ala Asn Val Val His Asp Ser Gly Thr 
405 4X0 



<210> 28 
<211> 413 
<212> PRT 

<213> Haliotis tuberculata 
<220> 

<223> HtHl-d 



GlyVArg Asp Arg Asp Asn Tyr Val Glu Glu Val Thr Gly Ala Ser 



His lie Arg Lys Asn Leu Asn Asp Leu Asn Thr Gly Glu Met Glu Ser 
20 25 30 

Leu Arg Ala Ala Phe Leu His lie Gin Asp Asp Gly Thr Tyr Glu Ser 
35 40 45 

He Ala Gin Tyr His Gly Lys Pro Gly Lys Cys Gin Leu Asn Asp His 
50 55 60 

Asn lie Ala Cys Cys Val His Gly Met Pro Thr Phe Pro Gin Trp His 
65 70 75 80 

Arg Leu Tyr Val Val Gin Val Glu Asn Ala Leu Leu Asn Arg Gly Ser 
85 90 95 

Gly Val Ala Val Pro Tyr Trp Glu Trp Thr Ala Pro He Asp His Leu 
100 105 110 

Pro His Phe He Asp Asp Ala Thr Tyr Phe Asn Ser Arg Gin Gin Arg 
115 120 125 

|yr Asp Pro Asn Pro Phe Phe Arg Gly Lys Val Thr Phe Glu Asn Ala 
130 135 140 

Val Thr Thr Arg Asp Pro Gin Ala Gly Leu Phe Asn Ser Asp Tyr Met 
145 150 " 155 160 

Tyr Glu Asn Val Leu Leu Ala Leu Glu Gin Glu Asn Tyr Cys Asp Phe 
165 170 " 175 

Glu He Gin Phe Glu Leu Val His Asn Ala Leu His Ser Met Leu Gly 
180 185 190 

Gly Lys Gly Gin Tyr Ser Met Ser Ser Leu Asp Tyr Ser Ala Phe Asp 
195 200 205 

Pro Val Phe Phe Leu His His Ala Asn Thr Asp Arg Leu Trp Ala He 
210 215 220 

Trp Gin Glu ma Glu Arg Plm Arg Glu Leu Pru Tyr Glu Glu Ala Ann — 

225 230 235 240 

kCys Ala He Asn Leu Met His Gin Pro Leu Lys Pro Phe Ser Asp Pro 
245 250 255 

His Glu Asn His Asp Asn Val Thr Leu Lys Tyr Ser Lys Pro Gin Asp 
260 265 270 

Gly Phe Asp Tyr Gin Asn His Phe Gly Tyr Lys Tyr Asp Asn Leu Glu 
275 280 ' ~ 285 

Phe His His Leu Ser He Pro Ser Leu Asp Ala Thr Leu Lys Gin Arg 
290 295 300 

Arg Asn His Asp Arg Val Phe Ala Gly Phe Leu Leu His Asn He Gly 
305 310 315 320 

Thr Ser Ala Asp He Thr He Tyr lie Cys Leu Pro Asp Gly Arg Arg 

325 330 335 

Gly Asn Asp Cys Ser His Glu Ala Gly Thr Phe Tyr He Leu Gly Gly 
340 345 ' 350 



Glu Thr Glu Met Pro Phe lie Phe Asp Arg Leu Tyr Lys Phe Glu lie 
355 360 365 



Thr Lys Pro Leu Gin Gin Leu Gly Val Lys Leu His Gly Gly Val Phe 

370 375 380 

Glu Leu Glu Leu Glu He Lys Ala Tyr Asn Gly Ser Tyr Leu Asp Pro 
385 390 395 400 

His Thr Phe Asp Pro Thr He He Phe Glu Pro Gly Thr 
405 410 



<210> 29 
<211> 420 
<212> PRT 

<213> Haliotis tuberculata 
<220> 

<223> HtHl-e 



Asp Thr His He Leu Asp His Asp His Glu Glu Glu He Leu Val Arg 
, 5 10 15 



Asn He He Asp Leu Ser Pro Arg Glu Arg Val Ser Leu Val Lys 
20 25 30 

Ala Leu Gin Arg Met Lys Asn Asp Arg Ser Ala Asp Gly Tyr Gin Ala 
35 40 45 

He Ala Ser Phe His Ala Leu Pro Pro Leu Cys Pro Asn Pro Ser Ala 



Ala His Arg Tyr Ala Cys Cys Val His Gly Met Ala Thr Phe Pro Gin 
65 ' "70 75 80 

Trp His Arg Leu Tyr Thr Val Gin Val Gin Asp Ala Leu Arg Arg His 
85 90 95 

Gly Ser Leu Val Gly He Pro Tyr Trp Asp Trp Thr Lys Pro Val Asn 

100 105 110 

Glu Leu Pro Glu Leu Leu Ser Ser Ala Thr Phe Tyr His Pro He Arg 
115 120 125 

in He Asn He Ser Asn Pro Phe Leu Gly Ala Asp He Glu Phe Glu 
130 135 140 

Gly Pro Gly Val His Thr Glu Arg His He Asn Thr Glu Arg Leu Phe 
145 150 155 I 60 

His Ser Gly Asp His Asp Gly Tyr His Asn Trp Phe Phe Glu Thr Val 
165 I 70 1/5 

Leu Phe Ala Leu Glu Gin Glu Asp Tyr Cys Asp Phe Glu lie Gin Phe 
180 185 I 90 

Glu He Ala His Asn Gly He His Thr Trp He Gly Gly Ser Ala Val 
195 200 205 

Tyr Gly Met Gly His Leu His Tyr Ala Ser Tyr Asp Pro He Phe Tyr 
210 215 220 

He His His Ser Gin Thr Asp Arg He Trp Ala He Trp Gin Glu Leu 
225 230 235 240 

Gin Lys Tyr Arg Gly Leu Ser Gly Ser Glu Ala Asn Cys Ala He Glu 



250 



255 



His Met Arg Thr Pro Leu Lys Pro Phe Ser Phe Gly Pro Pro Tyr Asn 
260 265 270 

Leu Asn Ser His Thr Gin Glu Tyr Ser Lys Pro Glu Asp Thr Phe Asp 
275 280 285 

Tyr Lys Lys Phe Gly Tyr Arg Tyr Asp Ser Leu Glu Leu Glu Gly Arg 
290 295 300 

Ser lie Ser Arg lie Asp Glu Leu lie Gin Gin Arg Gin Glu Lys Asp 

305 310 315 320 

Arg Thr Phe Ala Gly Phe Leu Leu Lys Gly Phe Gly Thr Ser Ala Ser 
325 330 335 

Val Ser Leu Gin Val Cys Arg Val Asp His Thr Cys Lys Asp Ala Gly 
340 345 350 

Tyr Phe Thr lie Leu Gly Gly Ser Ala Glu Met Pro Trp Ala Phe Asp 
355 360 365 

rg Leu Tyr Lys Tyr Asp lie Thr Lys Thr Leu His Asp Met Asn Leu 
370 375 380 

Arg His Glu Asp Thr Phe Ser lie Asp Val Thr lie Thr Ser Tyr Asn 
385 390 395 400 

Gly Thr Val Leu Ser Gly Asp Leu lie Gin Thr Pro Ser He He Phe 
405 410 415 



Val Pro Gly Arg 
420 



<210> 30 
<211> 417 
<212> PRT 

<213> Haliotis tuberculata 



<220> 

<223> HtHl-f 

• <400> 30 
His Lys Leu Asn Ser Arg Lys His Thr Pro Asn Arg Val Arg His Glu 
15 10 15 

Leu Ser Ser Leu Ser Ser Arg Asp He Ala Ser Leu Lys Ala Ala Leu 
20 25 30 

Thr Ser Leu Gin His Asp Asn Gly Thr Asp Gly Tyr Gin Ala He Ala 
35 40 45 

Ala Phe His Gly Val Pro Ala Gin Cys His Glu Pro Ser Gly Arg Glu 
50 55 60 

He Ala Cys Cys He His Gly Met Ala Thr Phe Pro His Trp His Arg 
65 70 75 80 

Leu Tyr Thr Leu Gin Leu Glu Gin Ala Leu Arg Arg His Gly Ser Ser 

85 90 95 

Val Ala Val Pro Tyr Trp Asp Trp Thr Lys Pro He Thr Glu Leu Pro 
100 105 110 



His lie Leu Thr Asp Gly Glu Tyr Tyr Asp Val Trp Gin Asn Ala Val 
115 120 125 

Leu Ala Asn Pro Phe Ala Arg Gly Tyr Val Lys lie Lys Asp Ala Phe 
130 135 140 

Thr Val Arg Asn Val Gin Glu Ser Leu Phe Lys Met Ser Ser Phe Gly 
145 150 155 160 

Lys His Ser Leu Leu Phe Asp Gin Ala Leu Leu Ala Leu Glu Gin Thr 
165 170 175 

Asp Tyr Cys Asp Phe Glu Val Gin Phe Glu Val Met His Asn Thr He 
180 185 190 

His Tyr Leu Val Gly Gly Arg Gin Thr Tyr Ala Phe Ser Ser Leu Glu 
195 200 205 

Tyr Ser Ser Tyr Asp Pro He Phe Phe He His His Ser Phe Val Asp 
210 " 215 220 

Lys He Trp Ala Val Trp Gin Glu Leu Gin Ser Arg Arg His Leu Gin 
k ' - " 230 235 240 

Fphe Arg Thr Ala Asp Cys Ala Val Gly Leu Met Gly Gin Ala Met Arg 

245 250 255 

Pro Phe Asn Lys Asp Phe Asn His Asn Ser Phe Thr Lys Lys His Ala 
260 265 270 

Val Pro Asn Thr Val Phe Asp Tyr Glu Asp Leu Gly Tyr Asn Tyr Asp 
275 280 285 

Asn Leu Glu He Ser Gly Leu Asn Leu Asn Glu He Glu Ala Leu He 
290 295 300 

Ala Lys Arg Lys Ser His Ala Arg Val Phe Ala Gly Phe Leu Leu Phe 
305 310 315 320 

Gly Leu Gly Thr Ser Ala Asp He His Leu Glu He Cys Lys Thr Ser 



Glu Asn Cys His Asp Ala Gly Val He Phe He Leu Gly Gly Ser Ala 
340 345 350 

Glu Met His Trp Ala Tyr Asn Arg Leu Tyr Lys Tyr Asp He Thr Glu 
355 360 365 

Ala Leu Gin Glu Phe Asp He Asn Pro Glu Asp Val Phe His Ala Asp 
370 375 380 

Glu Pro Phe Phe Leu Arg Leu Ser Val Val Ala Val Asn Gly Thr Val 
385 390 395 400 

He Pro Ser Ser His Leu His Gin Pro Thr He He Tyr Glu Pro Gly 
405 410 415 



<210> 31 
<211> 403 
<212> PRT 

<213> Haliotis tuberculata 



51 



<220> 

<223> HtHl-g 
<400> 31 

Asp His His Asp Asp His Gin Ser Gly Ser lie Ala Gly Ser Gly Val 
1 5 10 15 

Arg Lys Asp Val Asn Thr Leu Thr Lys Ala Glu Thr Asp Asn Leu Arg 
20 25 30 

Glu Ala Leu Trp Gly Val Met Ala Asp His Gly Pro Asn Gly Phe Gin 
35 40 45 

Ala lie Ala Ala Phe His Gly Lys Pro Ala Leu Cys Pro Met Pro Asp 
50 55 60 

Gly His Asn Tyr Ser Cys Cys Thr His Gly Met Ala Thr Phe Pro His 
65 70 75 80 

Trp His Arg Leu Tyr Thr Lys Gin Met Glu Asp Ala Met Arg Ala His 
85 90 95 

kGly Ser His Val Gly Leu Pro Tyr Trp Asp Trp Thr Ala Ala Phe Thr 
100 105 110 

His Leu Pro Thr Leu Val Thr Asp Thr Asp Asn Asn Pro Phe Gin His 
115 120 125 

Gly His lie Asp Tyr Leu Asn Val Ser Thr Thr Arg Ser Pro Arg Asp 
130 ' 135 140 

Met Leu Phe Asn Asp Pro Glu His Gly Ser Glu Ser Phe Phe Tyr Arg 
145 150 155 160 

Gin Val Leu Leu Ala Leu Glu Gin Thr Asp Phe Cys Lys Phe Glu Val 
165 170 " 175 

Gin Phe Glu He Thr His Asn Ala He His Ser Trp Thr Gly Gly His 
180 185 190 

Sul Piu Tyi Gly Met bfer Thr Leu Asp Phe Thr Ala Tyr Asp Pro Leu 

195 200 205 

. Phe Trp Leu His His Ser Asn Thr Asp Arg He Trp Ala Val Trp Gin 
210 215 220 

' Ala Leu Gin Glu Tyr Arg Gly Leu Pro Tyr Asn His Ala Asn Cys Glu 

225 230 235 240 

He Gin Ala Met Lys Thr Pro Leu Arg Pro Phe Ser Asp Asp He Asn 
245 250 255 

His Asn Pro Val Thr Lys Ala Asn Ala Lys Pro Leu Asp Val Phe Glu 
260 265 270 

Tyr Asn Arg Leu Ser Phe Gin Tyr Asp Asn Leu He Phe His Gly Tyr 
275 280 285 



Ser He Pro Glu Leu Asp Arg Val Leu Glu Glu Arg Lys Glu Glu Asp 
290 295 300 

Arg He Phe Ala Ala Phe Leu Leu Ser Gly He Lys Arg Ser Ala Asp 

305 310 315 320 

Val Val Phe Asp He Cys Gin Pro Glu His Glu Cys Val Phe Ala Gly 

325 330 335 



52 



Thr Phe Ala lie Leu Gly Gly Glu Leu Glu Met Pro Trp Ser Phe Asp 
340 345 350 

Arg Leu Phe Arg Tyr Asp lie Thr Lys Val Met Lys Gin Leu His Leu 
355 360 365 

Arg His Asp Ser Asp Phe Thr Phe Arg Val Lys lie Val Gly Thr Asp 
370 375 380 

Asp His Glu Leu Pro Ser Asp Ser Val Lys Ala Pro Thr lie Glu Phe 
385 390 395 400 



Glu Pro Gly 



<210> 32 
<211> 511 
<212> PRT 

<213> Haliotis tuberculata 
220> 

223> HtHl-h 
<400> 32 

Val His Arg Gly Gly Asn His Glu Asp Glu His His Asp Asp Arg Leu 
15 10 15 

Ala Asp Val Leu lie Arg Lys Glu Val Asp Phe Leu Ser Leu Gin Glu 
20 25 30 

Ala Asn Ala lie Lys Asp Ala Leu Tyr Lys Leu Gin Asn Asp Asp Ser 
35 40 45 

Lys Gly Gly Phe Glu Ala lie Ala Gly Tyr His Gly Tyr Pro Asn Met 
50 55 60 

Cys Pro Glu Arg Gly Thr Asp Lys Tyr Pro Cys Cys Val His Gly Met 
65 70 75 80 



Pro Val Phe Pro His Trp His Arg Leu His Thr He Gin Met Glu Arg 
85 90 95 

^^^^■Ala Leu Lys Asn His Gly Ser Pro Met Gly lie Pro Tyr Trp Asp Trp 

^^^V ioo no 

Thr Lys Lys Met Ser Ser Leu Pro Ser Phe Phe Gly Asp Ser Ser Asn 
115 120 125 

Asn Asn Pro Phe Tyr Lys Tyr Tyr He Arg Gly Val Gin His Glu Thr 
130 135 140 

Thr Arg Asp Val Asn Gin Arg Leu Phe Asn Gin Thr Lys Phe Gly Glu 
145 150 155 160 

Phe Asp Tyr Leu Tyr Tyr Leu Thr Leu Gin Val Leu Glu Glu Asn Ser 
165 170 175 

Tyr Cys Asp Phe Glu Val Gin Tyr Glu He Leu His Asn Ala Val His 
180 185 190 

Ser Trp Leu Gly Gly Thr Gly Gin Tyr Ser Met Ser Thr Leu Glu Tyr 
195 ' 200 205 

Ser Ala Phe Asp Pro Val Phe Met He His His Ser Ser Leu Asp Arg 




He Trp He Leu Trp Gin Lys Leu Gin Lys lie Arg Met Lys Pro Tyr 

225 230 235 240 

Tyr Ala Leu Asp Cys Ala Gly Asp Arg Leu Met Lys Asp Pro Leu His 

245 250 " 255 

Pro Phe Asn Tyr Glu Thr Val Asn Glu Asp Glu Phe Thr Arg He Asn 

260 265 270 

Ser Phe Pro Ser He Leu Phe Asp His Tyr Arg Phe Asn Tyr Glu Tyr 

275 280 ~ 285 

Asp Asn Met Arg He Arg Gly Gin Asp He His Glu Leu Glu Glu Val 

290 295 300 

lie Gin Glu Leu Arg Asn Lys Asp Arg He Phe Ala Gly Phe Val Leu 

305 310 315 320 

Ser Gly Leu Arg lie Ser Ala Thr Val Lys Val Phe He His Ser Lys 

325 330 335 



n Asp Thr Ser His Glu Glu Tyr Ala Gly Glu Phe Ala Val Leu Gly 
340 345 350 



Gly Glu Lys Glu Met Pro Trp Ala Tyr Glu Arg Met Leu Lys Leu Asp 
355 360 365 

He Ser Asp Ala Val His Lys Leu His Val Lys Asp Glu Asp He Arg 
370 375 380 

Phe Arg Val Val Val Thr Ala Tyr Asn Gly Asp Val Val Thr Thr Arg 
385 390 395 400 

Leu Ser Gin Pro Phe He Val His Arg Pro Ala His Val Ala His Asp 
405 410 415 

He Leu Val He Pro Val Gly Ala Gly His Asp Leu Pro Pro Lys Val 
420 * 425 430 



Val Val Lys Ser Gly Thr Lys Val Glu Phe Thr Pro He Asp Ser Ser 
435 440 445 

^Val Asn Lys Ala Met Val Glu Leu Gly Ser Tyr Thr Ala Met Ala Lys 
450 455 460 

Cys He Val Pro Pro Phe Ser Tyr His Gly Phe Glu Leu Asp Lys Val 
465 470 475 480 

Tyr Ser Val Asp His Gly Asp Tyr Tyr He Ala Ala Gly Thr His Ala 
485 490 495 



Leu Cys Glu Gin Asn Leu Arg Leu His He His Val Glu His Glu 
500 505 510 



<210> 33 
<211> 334 
<212> PRT 

<213> Haliotis tuberculata 

<220> 

<223> HtH2-b 



<400> 33 



54 



Arg Leu Phe Val Thr Gin Val Glu Asp Ala Leu lie Arg Arg Gly 

5 10 15 

Pro lie Gly Val Pro Tyr Trp Asp Trp Thr Gin Pro Met Ala His 
20 25 30 

Pro Gly Leu Ala Asp Asn Ala Thr Tyr Arg Asp Pro lie Ser Gly 



Asp 

Gly 
65 

Phe 



Thr 
145 

Arg 
Lys 
Glu 



Ser Arg His Asn Pro Phe His Asp Val Glu Val Ala Phe Glu Asn 
50 55 60 

Arg Thr Glu Arg His Pro Asp Ser Arg Leu Phe Glu Gin Pro Leu 
70 75 80 

Gly Lys His Thr Arg Leu Phe Asp Ser He Val Tyr Ala Phe Glu 
' * 85 90 95 

Glu Asp Phe Cys Asp Phe Glu Val Gin Phe Glu Met Thr His Asn 
100 105 HO 

He His Ala Trp He Gly Gly Gly Glu Lys Tyr Ser Met Ser Ser 
115 120 125 

His Tyr Thr Ala Phe Asp Pro He Phe Tyr Leu Arg His Ser Asn 

130 135 140 

Asp Arg Leu Trp Ala He Trp Gin Ala Leu Gin He Arg Arg Asn 
150 155 160 

Pro Tyr Lys Ala His Cys Ala Trp Ser Glu Glu Arg Gin Pro Leu 
165 170 175 

Pro Phe Ala Phe Ser Ser Pro Leu Asn Asn Asn Glu Lys Thr Tyr 
180 185 190 

Asn Ser Val Pro Thr Asn Val Tyr Asp Tyr Glu Gly Val Leu Gly 
195 200 205 

Thr Tyr Asp Asp Leu Asn Phe Gly Gly Met Asp Leu Gly Gin Leu 

9-in 2iS 220 



Glu 
225 



Asp 
Gly 



Ser 
305 



Glu Tyr He Gin Arg Gin Arg Gin Arg Asp Arg Thr Phe Ala Gly 
230 235 240 

Phe Leu Ser His He Gly Thr Ser Ala Asn Val Glu He He He 
245 250 255 

His Gly Thr Leu His Thr Ser Val Gly Thr Phe Ala Val Leu Gly 
260 265 270 

Glu Lys Glu Met Lys Trp Gly Phe Asp Arg Leu Tyr Lys Tyr Glu 
275 280 285 

• Thr Asp Glu Leu Arg Gin Leu Asn Leu Arg Ala Asp Asp Val Phe 
290 295 300 

He Ser Val Lys Val Thr Asp Val Asp Gly Ser Glu Leu Ser Ser 
310 315 320 

Leu He Pro Ser Ala Ala He He Phe Glu Arg Ser His 
325 330 



<210> 34 
<211> 417 



<212> PRT 

<213> Haliotis tuberculata 



<220> 

<223> HtH2-c 



<400> 34 

lie Asp His Gin Asp Pro His His Asp Thr He lie Arg Lys Asn Val 



Asp Asn Leu Thr Pro Glu Glu He Asn Ser Leu Arg Arg Ala Met Ala 



Asp Leu Gin Ser Asp Lys Thr Ala Gly Gly Phe Gin Gin He Ala Ala 
35 40 45 

Phe His Gly Glu Pro Lys Trp Cys Pro Ser Pro Asp Ala Glu Lys Lys 
50 55 60 

Phe Ser Cys Cys Val His Gly Met Ala Val Phe Pro His Trp His Arg 
65 70 75 80 

kLeu Leu Thr Val Gin Gly Glu Asn Ala Leu Arg Lys His Gly Cys Leu 
85 90 95 

r Gly Ala Leu Pro Tyr Trp Asp Trp Thr Arg Pro Leu Ser His Leu Pro 
100 105 110 

Asp Leu Val Leu Val Ser Ser Arg Thr Thr Pro Met Pro Tyr Ser Thr 
115 120 125 

Val Glu Ala Arg Asn Pro Trp Tyr Ser Gly His He Asp Thr Val Gly 
130 135 140 

Val Asp Thr Thr Arg Ser Val Arg Gin Glu Leu Tyr Glu Ala Pro Gly 
145 * 150 155 160 

Phe Gly His Tyr Thr Gly Val Ala Lys Gin Val Leu Leu Ala Leu Glu 
165 170 175 

Gin Asp Asp Phe Cys Asp Php Glu Val Gin -Php Glu lie Ala His Asn 



Phe He His Ala Leu Val Gly Gly Ser Glu Pro Tyr Gly Met Ala Ser 
195 200 205 

^Leu Arg Tyr Thr Thr Tyr Asp Pro He Phe Tyr Leu His His Ser Asn 

210 215 220 

Thr Asp Arg Leu Trp Ala He Trp Gin Ala Leu Gin Lys Tyr Arg Gly 
225 230 235 240 

Lys Pro Tyr Asn Ser Ala Asn Cys Ala He Ala Ser Met Arg Lys Pro 
245 250 255 

Leu Gin Pro Phe Gly Leu Thr Asp Glu He Asn Pro Asp Asp Glu Thr 
260 265 270 

Arg Gin His Ala Val Pro Phe Ser Val Phe Asp Tyr Lys Asn Asn Phe 
275 280 285 

Asn Tyr Glu Tyr Asp Thr Leu Asp Phe Asn Gly Leu Ser He Ser Gin 
290 295 300 



Leu Asp Arg Glu Leu Ser Arg Arg Lys Ser His Asp Arg Val Phe Ala 
305 " 310 315 320 



56 



Gly Phe Leu Leu His Gly lie Gin 
325 



Val Cys Lys Ser Asp Asp Asp Cys 
340 

He Leu Gly Asp Glu Ala Glu Met 
355 360 

Lys Tyr Glu He Thr Glu Gin Leu 
370 375 

Asp Arg Phe Phe He Arg Tyr Glu 
385 390 

Leu Gly Ser Asn He Phe Pro Lys 
405 



Ala 



Gin Ser Ala Leu Val Lys Phe Phe 
330 335 

Asp His Tyr Ala Gly Glu Phe Tyr 
345 350 

Pro Trp Gly Tyr Asp Arg Leu Tyr 
365 



Asn Ala Leu Asp Leu His He Gly 
380 

Ala Phe Asp Leu His Gly Thr Ser 
395 400 

Pro Ser Val He His Asp Glu Gly 
410 415 



|<210> 


35 


'<211> 


415 


<212> 


PRT 


<213> 


Haliotis 


<220> 




<223> 


HtH2-d 


<400> 


35 


Gly His His Gil 


1 





His He Arg Lys Asn Leu Lys Asp Leu Ser Lys Gly Glu Val Glu Ser 
20 25 30 

Leu Arg Ser Ala Phe Leu Gin Leu Gin Asn Asp Gly Val Tyr Glu Asn 



He Ala Lys Phe His Gly Lys Pro Gly Leu Cys Asp Asp Asn Gly Arg 
50 55 60 

Lys Val Ala Cys Cys Val His Gly Met Pro Thr Phe Pro Gin Trp His 
65 70 ~ 75 80 

Arg Leu Tyr Val Leu Gin Val Glu Asn Ala Leu Leu Glu Arg Gly Ser 
85 90 95 

Ala Val Ser Val Pro Tyr Trp Asp Trp Thr Glu Thr Phe Thr Glu Leu 
100 " 105 HO 

Pro Ser Leu He Ala Glu Ala Thr Tyr Phe Asn Ser Arg Gin Gin Thr 
115 120 125 

Phe Asp Pro Asn Pro Phe Phe Arg Gly Lys He Ser Phe Glu Asn Ala 
130 135 140 

Val Thr Thr Arg Asp Pro Gin Pro Glu Leu Tyr Val Asn Arg Tyr Tyr 
145 150 155 160 

Tvr Gin Asn Val Met Leu Val Phe Glu Gin Asp Asn Tyr Cys Asp Phe 
165 170 175 

Glu He Gin Phe Glu Met Val His Asn Val Leu His Ala Trp Leu Gly 



Gly Arg Ala Thr Tyr Ser lie Ser Ser Leu Asp Tyr Ser Ala Phe Asp 
195 200 205 

Pro Val Phe Phe Leu His His Ala Asn Thr Asp Arg Leu Trp Ala He 
210 215 220 

Trp Gin Glu Leu Gin Arg Tyr Arg Lys Lys Pro Tyr Asn Glu Ala Asp 
225 230 235 240 

Cys Ala He Asn Leu Met Arg Lys Pro Leu His Pro Phe Asp Asn Ser 
245 250 255 

Asp Leu Asn His Asp Pro Val Thr Phe Lys Tyr Ser Lys Pro Thr Asp 
260 265 270 

Gly Phe Asp Tyr Gin Asn Asn Phe Gly Tyr Lys Tyr Asp Asn Leu Glu 
275 280 285 

Phe Asn His Phe Ser He Pro Arg Leu Glu Glu He He Arg He Arg 

290 295 300 

bin Arg Gin Asp Arg Val Phe Ala Gly Phe Leu Leu His Asn He Gly 
f305 310 315 320 

Thr Ser Ala Thr Val Glu He Phe Val Cys Val Pro Thr Thr Ser Gly 
325 330 335 

Glu Gin Asn Cys Glu Asn Lys Ala Gly Thr Phe Ala Val Leu Gly Gly 
340 345 350 

Glu Thr Glu Met Ala Phe His Phe Asp Arg Leu Tyr Arg Phe Asp He 
355 360 " 365 

Ser Glu Thr Leu Arg Asp Leu Gly He Gin Leu Asp Ser His Asp Phe 
370 375 ~ 380 

Asp Leu Ser He Lys He Gin Gly Val Asn Gly Ser Tyr Leu Asp Pro 
385 390 395 " 400 

His He Leu Pro Glu Pro Ser Leu He Phe Val Pro Gly Ser Ser 
405 410 415 



P<210> 36 

f <211> 418 

<212> PRT 

<213> Haliotis tuberculata 
<220> 

<223> HtH2-e 
<400> 36 

Ser Phe Leu Arg Pro Asp Gly His Ser Asp Asp He Leu Val Arg Lys 
15 10 15 

Glu Val Asn Ser Leu Thr Thr Arg Glu Thr Ala Ser Leu He His Ala 



Leu Lys Ser Met Gin Glu Asp His Ser Pro Asp Gly Phe Gin Ala He 
35 40 45 



Ala Ser Phe His Ala Leu Pro Pro Leu Cys Pro Ser Pro Ser Ala Ala 
50 55 60 



His Arg Tyr Ala Cys Cys Val His Gly Met Ala Thr Phe Pro Gin Trp 
65 70 75 80 

His Arg Leu Tyr Thr Val Gin Phe Gin Asp Ala Leu Arg Arg His Gly 
85 90 95 

Ala Thr Val Gly Val Pro Tyr Trp Asp Trp Leu Arg Pro Gin Ser His 
100 105 110 

Leu Pro Glu Leu Val Thr Met Glu Thr Tyr His Asp lie Trp Ser Asn 
115 120 * 125 

Arg Asp Phe Pro Asn Pro Phe Tyr Gin Ala Asn lie Glu Phe Glu Gly 
130 135 140 

Glu Asn He Thr Thr Glu Arg Glu Val He Ala Asp Lys Leu Phe Val 
145 150 155 160 

Lys Gly Gly His Val Phe Asp Lys Leu Val Leu Gin Thr Ser His Pro 
165 170 175 

Ser Ala Glu Gin Glu Asn Tyr Cys Asp Phe Glu He Gin Phe Glu He 
180 185 190 

Leu His Asn Gly Val His Thr Trp Val Gly Gly Ser Arg Thr Tyr Ser 
195 " 200 205 

He Gly His Leu His Tyr Ala Phe Tyr Asp Pro Leu Phe Tyr Leu His 
210 215 220 

His Phe Gin Thr Asp Arg He Trp Ala He Trp Gin Glu Leu Gin Glu 

225 230 235 240 

Gin Arg Gly Leu Ser Gly Asp Glu Ala His Cys Ala Leu Glu Gin Met 
245 250 255 

Arg Glu Pro Leu Lys Pro Phe Ser Phe Gly Ala Pro Tyr Asn Trp Asn 
260 265 270 

Gin Leu Thr Gin Asp Phe Ser Arg Pro Glu Asp Thr Phe Asp Tyr Arg 
2*5 2&9 2*5 



Lys Phe Gly Tyr Glu Tyr Asp Asn Leu Glu Phe Leu Gly Met Ser Val 
290 295 300 



a Glu Leu Asp Gin Tyr He He Glu His Gin Glu Asn Asp Arg Val 
305 310 315 320 

Phe Ala Gly Phe Leu Leu Ser Gly Phe Gly Gly Ser Ala Ser Val Asn 
325 330 335 

Phe Gin Val Cys Arg Ala Asp Ser Thr Cys Gin Asp Ala Gly Tyr Phe 
340 345 350 

Thr Val Leu Gly Gly Ser Ala Glu Met Ala Trp Ala Phe Asp Arg Leu 
355 ' 360 365 

Tyr Lys Tyr Asp He Thr Glu Thr Leu Glu Lys Met His Leu Arg Tyr 
370 " 375 380 



Asp Asp Asp Phe Thr He Ser Val Ser Leu Thr Ala Asn Asn Gly Thr 
385 390 395 400 

Val Leu Ser Ser Ser Leu He Pro Thr Pro Ser Val He Phe Gin Arg 
405 410 415 
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<210> 37 
<211> 416 
<212> PRT 

<213> Haliotis tuberculata 
<220> 

<223> HtH2-f 
<400> 37 

Arg. Asp lie Asn Thr Arg Set Met Ser Pro Asn Arg Val Arg Arg Glu 
1 5 10 15 

Leu Ser Asp Leu Ser Ala Arg Asp Leu Ser Ser Leu Lys Ser Ala Leu 
20 25 30 

Arg Asp Leu Gin Glu Asp Asp Gly Pro Asn Gly Tyr Gin Ala Leu Ala 



^^^^Ala 



Phe His Gly Leu Pro Ala Gly Cys His Asp Ser Arg Gly Asn Glu 
50 55 60 



lie Ala Cys Cys lie His Gly Met Pro Thr Phe Pro Gin Trp His Arg 
65 70 75 80 

Leu Tyr Thr Leu Gin Leu Glu Met Ala Leu Arg Arg His Gly Ser Ser 
85 90 95 

Val Ala lie Pro Tyr Trp Asp Trp Thr Lys Pro He Ser Glu Leu Pro 
100 105 110 

Ser Leu Phe Thr Ser Pro Glu Tyr Tvr Asp Pro Trp His Asp Ala Val 
115 120 125 

Val Asn Asn Pro Phe Ser Lys Gly Phe' Val Lys Phe Ala Asn Thr Tyr 
130 135 140 



Thr Val Arg Asp Pro Gin Glu Met Leu Phe Gin Leu Cys Glu His Gly 
145 " 150 155 160 

k Glu Ser He Leu Tyr Glu Gin Thr Leu Leu Ala Leu Glu Gin Thr Asp 
165 170 175 

Tyr Cys Asp Phe Glu Val Gin Phe Glu Val Leu His Asn Val He His 
180 185 190 

Tyr Leu Val Gly Gly Arg Gin Thr Tvr Ala Leu Ser Ser Leu His Tyr 
195 200 205 

Ala Ser Tyr Asp Pro Phe Phe Phe lie His His Ser Phe Val Asp Lys 
210 215 220 

Met Trp Val Val Trp Gin Ala Leu Gin Lys Arg Arg Lys Leu Pro Tyr 
225 230 235 240 

Lys Arg Ala Asp Cys Ala Val Asn Leu Met Thr Lys Pro Met Arg Pro 
245 250 255 

Phe Asp Ser Asp Met Asn Gin Asn Pro Phe Thr Lvs Met His Ala Val 
260 265 • 270 



Pro Asn Thr Leu Tyr Asp Tyr Glu Thr Leu Tyr Tyr Ser Tyr Asp Asn 
275 280 285 



60 



Leu Glu lie Gly Gly Arg Asn Leu Asp Gin Leu Gin Ala Glu lie Asp 
290 295 300 

Arg Ser Arg Ser His Asp Arg Val Phe Ala Gly Phe Leu Leu Arg Gly 
305 310 315 320 

lie Gly Thr Ser Ala Asp Val Arg Phe Trp lie Cys Arg Asn Glu Asn 
325 330 335 

Asp Cys His Arg Gly Gly lie lie Phe lie Leu. Gly Gly Ala Lys Glu 
340 345 350 



Met Pro Trp Ser Phe Asp Arg Asn Phe Lys Phe Asp lie Thr His Val . 
355 360 365 

Leu Glu Asn Ala Gly lie Ser Pro Glu Asp Val Phe Asp Ala Glu Glu 
370 375 380 

Pro Phe Tyr lie Lys Val Glu lie His Ala Val Asn Lys Thr Met lie 
385 390 395 400 

fc>ro Ser Ser Val lie Pro Ala Pro Thr He He Tyr Ser Pro Gly Glu 
4,05 410 415 



<210> 38 
<211> 402 
<212> PRT 

<213> Haliotis tuberculata 
<220> 

<223> HtH2-g 
<400> 38 

Gly Arg Ala Ala Asp Ser Ala His Ser Ala Asn lie Ala Gly Ser Gly 
1 5 in > 15 



Val Arg Lys Asp Val Thr Thr Leu Thr Val Ser Glu Thr Glu Asn Leu 

20 25 30 

Gin Ala Leu Gin Gly Val He Asp Asp Thr Gly Pro Asn Gly Tyr 

35 '40 45 

Gin Ala He Ala Ser Phe His Gly Ser Pro Pro Met Cys Glu Met Asn 

50 55 60 

Gly Arg Lys Val Ala Cys Cys Ala His Gly Met Ala Ser Phe Pro His 

65 70 75 80 

Trp His Arg Leu Tyr Val Lys Gin Met Glu Asp Ala Leu Ala Asp His 

85 ' 90 .95 

Gly Ser His He Gly He Pro Tyr Trp Asp Trp Thr Thr Ala Phe Thr 

100 105 110 

Glu Leu Pro Ala Leu Val Thr Asp Ser Glu Asn Asn Pro Phe His Glu 

115 120 125 

Gly Arg He Asp His Leu Gly Val Thr Thr Ser Arg Ser -Pro Arg Asp 

130 135 140 

Met Leu Phe Asn Asp Pro Glu Gin Gly Ser Glu Ser Phe Phe Tyr Arg 



61 



Gin Val Leu Leu Ala Leu Glu Gin Thr Asp Tyr Cys Gin Phe Glu Val 
165 170 ' 175 

Gin Phe Glu Leu Thr His Asn Ala lie His Ser Trp Thr Gly Gly Arg 
180 185 ' 190 

Ser Pro Tyr Gly Met Ser Thr Leu Glu Phe Thr Ala Tyr Asp Pro Leu 
195 200 205 

Phe Trp Leu His His Ser Asn Thr Asp Arg lie Trp Ala Val Trp Gin 

210 215 220 ' 

Ala Leu Gin Lys Tyr Arg Gly Leu Pro Tyr Asn Glu Ala His Cys Glu 
225 230 235 240 

lie Gin Val Leu Lys Gin Pro Leu Arg Pro Phe Asn Asp Asp lie Asn 
245 250 255 

His Asn Pro lie Thr Lys Thr Asn Ala Arg Pro lie Asp Ser Phe Asp 
260 265 270 

Tyr Glu Arg Phe Asn Tyr Gin Tyr Asp Thr Leu Ser Phe His Gly Lys 
275 280 285 

Ser lie Pro Glu Leu Asn Asp Leu Leu Glu Glu Arg Lys Arg Glu Glu 
290 295 300 

Arg Thr Phe Ala Ala Phe Leu Leu Arg Gly He Gly Cys Ser Ala Asp 
305 310 315 320 

Val Val Phe Asp He . Cys Arg Pro Asn Gly Asp Cys Val Phe Ala Gly 
325 330 335 

Thr Phe Ala Val Leu Gly Gly Glu Leu Glu Met Pro Trp Ser Phe Asp 
340 .345 350 

Arg Leu Phe Arg Tyr Asp He Thr Arg Val Met Asn Gin Leu His Leu 
155 1611 

Gin Tyr Asp Ser Asp Phe Ser Phe Arg Val Lys Leu Val Ala Thr Asn 
370 375 380 



FGly Thr Glu Leu Ser Ser Asp Leu Leu Lys Ser Pro Thr lie Glu His 
385 390 395 400 



<210> 39 
<211> 515 
<212> PRT 

<213> Haliotis tuberculata 
<220> 

<223> HtH2-h 
<400> 39 

Gly Ala His Arg Gly Pro Val Glu Glu Thr Glu Val Thr Arg Gin His 
1 5 10 15 



Thr Asp Gly Asn Ala His Phe His Arg Lys Glu Val Asp Ser Leu Ser 
20 25 30 



Leu Asp Glu Ala Asn Asn Leu Lys Asn Ala Leu Tyr Lys Leu Gin Asn 
35 40 45 

Asp His Ser Leu Thr Gly Tyr Glu Ala He Ser Gly Tyr His Gly Tyr 
50 55 60 



Pro Asn Leu Cys Pro Glu Glu Gly Asp Asp Lys He Pro Leu Leu Arg 
65 " 70 75 80 

Pro Arg Met Gly He Phe Pro Tyr Trp His Arg Leu Leu Thr He Gin 
85 90 95 

Leu Glu Arg Ala Leu Glu His Asn Gly Ala Leu Leu Gly Val Pro. Tyr 
100 105 . 110 

TrD Asp Trp Asn Lys Asp Leu Ser Ser Leu Pro Ala Phe Phe Ser Asp 
115 " " 120 125 

Ser Ser Asn Asn Asn Pro Tyr Phe Lys Tyr His lie Ala Gly Val Gly 
130 135 140 

His Asp Thr Val Arg Glu Pro Thr Ser Leu He Tyr Asn Gin Pro Gin 
1 150 155 1.60 

lie His Gly Tyr Asp Tyr Leu Tyr Tyr Leu Ala Leu Thr Thr Leu Glu 
165 170 175 

Glu Asn Asn Tyr Trp Asp Phe Glu Val Gin Tyr Glu He Leu His Asn 
180 185 190 

Ala Val His Ser Trp Leu Gly Gly Ser Gin Lys Tyr Ser Met Ser Thr 
195 - 200 205 

Leu Glu Tyr Ser Ala Phe Asp Pro Val Phe Met He Leu His Ser Gly 
210 215 220 

Leu Asp Arg Leu Trp He He Trp Gin Glu Leu Gin Lys He Arg Arg 
225 230 235 240 

. Lys 



Tyr Asn Phe Ala Lya Cya Ala Tyr- 



kLeu Ala Pro Phe Ser Tyr Pro Ser lie Asn Gin Asp Glu Phe Thr Arg 

2 60 265 27 0 

^Ala Asn Ser Lys Pro Ser Thr Val Phe Asp Ser His Lys Phe Gly Tyr 

275 280 285 

His Tyr Asp Asn Leu Asn Val Arg Gly His Ser He Gin Glu Leu Asn 

290 295 300 

Thr He He. Asn Asp Leu Arg Asn Thr Asp Arg He Tyr Ala Gly Phe 

305 310 315 320 

Val Leu Ser Gly He Gly Thr Ser Ala Ser Val Lys He Tyr Leu Arg 



Thr Asp Asp Asn Asp Glu Glu Val Gly Thr Phe Thr Val Leu Gly Gly 

V 340 345 350 

LGlu Arg Glu Met Pro Trp Ala Tyr Glu Arg Val Phe Lys Tyr Asp lie 
355 360 365 

Thr Glu Val Ala Asp Arg Leu Lys He Lys Leu Trp Gly His Pro Leu 
370 " 375 380 



63 



Thr Ser Gly Thr Gly Asp His He Leu Thr Asn Gly He Gly Gly Lys 
385 390 395 400 

Gin Glu Pro Thr Gin He Leu Ser Ser Ser Thr Asp Leu Pro He Met 
405 410 415 

Thr Thr Met Phe Leu Leu Ser Gin Xaa Gly Arg Asn Leu His He Pro 
420 425 • " 430 

Pro Lys Val Val Val Lys Lys Gly Thr Arg He Glu Phe His Pro Val 
435 440 445 

Asp Asp Ser Val Thr Arg Pro Val Val Asp Leu Gly Ser Tyr Thr Ala 
450 455 460 

Leu Phe. Asn Cys Val Val Pro Pro Phe Thr Tyr His Gly Phe Glu Leu 
465 470 475 480 

Asn His Val Tyr Ser Val Lys Pro Gly Asp Tyr Tyr Val Thr Gly Pro 
485 490 " 495 

WThr Arg Asp Leu Cys Gin Asn Ala Asp Val Arg He His He His Val 
500 505 510 

Glu Asp Glu 
515 



<210> 40 
<211> 322 
<212> PRT 

<213> Megathura crenulata 
<220> 

<223> KLHl-b 
<400> 4 0 

Gly Leu Pro Tyr Trp Asp Trp Thr Glu Pro Met Thr His He Pro Gly 
1 5 10 15 



Leu Ala Gly Asn Lys Thr Tyr Val Asp Ser His Gly Ala Ser His Thr 
20 25 " 30 

•Asn Pro Phe His Ser Ser Val He Ala Phe Glu Glu Asn Ala Pro His 
35 40 45 

Thr Lys Arg Gin lie Asp Gin Arg Leu Phe Lys Pro Ala Thr Phe Gly 
50 55 60 

His His Thr Asp Leu Phe Asn Gin He Leu Tyr Ala Phe Glu Gin Glu 
65 70 75 80 

Asp Tyr Cys Asp Phe Glu Val Gin Phe Glu He Thr His Asn Thr . He 
85 90 95 

His Ala Trp Thr Gly Gly Ser Glu His Phe Ser Met Ser Ser Leu His 
100 105 110 

Tyr Thr Ala Phe Asp Pro Leu Phe Tyr Phe His His Ser Asn Val Asp 
115 ' 120 125 

Arg Leu Trp Ala Val Trp Gin Ala Leu Gin Met Arg Arg His Lys Pro 
130 135 140 

Tyr Arg Ala His Cys Ala He Ser Leu Glu His Met His Leu Lys Pro 
145 150 155 160 



64 



Phe Ala 
Ala Met 



Pro Asn 
180 



Tyr Glu Asp Leu 
195 



Met He 
210 

Leu Ala 
225 

Thr Asp 
Ser Lys 
Thr His 



Val Thr 
290 



Leu He 
305 



His Glu 
Gly He 
Ser Val 



Glu Met 
260 



Val Leu 
275 



Val Asp 
Pro His 



Ser Pro 
165 

Lys He Tyr Asp 
Thr Phe 
Asn Gin 



i Asn Asn Glu Lys Thr 
170 



Gly Gly 
200 



Arg Thr 
230 

Gin His 
245 

Lys Trp 
Lys Asp 
He Thr 



Gin Glu 

215 

Ser Ala 
Lys Ala 
Gly Phe 



Leu Asp 
280 



Glu Val 
295 



Tyr Glu Asn Val Leu 
185 



He Ser Leu Glu Asn 
205 



Asp Arg He Tyr Ala 
220 



Asn Val Asp He Phe 
235 



Gly Thr Phe Ala Val 
250 



Asp Arg Val Phe Lys 
26S 



His Ala Asn 
175 



His Tyr Thr 
190 



He Glu Lys 
Gly Phe Leu 



He Lys Thr 
240 



Leu Gly Gly 
255 



Phe Asp He 
270 



Leu Thr Ala Asp Gly Asp Phe Glu 
285 



Asp Gly Thr Lys Leu 
300 



Ala Ser 
310 



Arg Glu His Ala Arg 
315 



Ala Ser Ser 



Gly Lvs Leu 
320 



<210> 41 
<211> 414 
<212> PRT 
<2J ^ M» ga t-hu 



<220> 
k <223> KLHl-c 

Jc400> 41 

FVal Lvs Phe Asp Lys Val Pro Arg Ser Arg Leu He Arg Lys Asn Val 
5 10 15 



Asp Arg Leu 



Ser Pro Glu Glu Met Asn Glu Leu Arg Lys Ala Leu Ala 



Leu Leu Lys Glu Asp Lys Ser Ala Gly Gly Phe Gin Gin Leu Gly Ala 

35 .40 45 

Phe His Gly Glu Pro Lys Trp Cys Pro Ser Pro Glu Ala Ser Lys Lys 

50 55 60 

Phe Ala Cys Cys Val His Gly Met Ser Val Phe Pro His Trp His Arg 

65 70 . 75 80 

Leu Leu Thr Val Gin Ser Glu Asn Ala Leu Arg Arg His Gly Tyr Asp 

85 90 95 

Gly Ala Leu Pro Tyr Trp Asp Trp Thr Ser Pro Leu Asn His Leu Pro 

100 105 110 



65 



Glu Leu Ala Asp^lis Glu Lys Tyr Val Asp Pro Glu Asp Gly Val Glu 



Lys His Asn Pro Trp Phe. Asp Gly His He Asp Thr Val Asp Lys Thr 
130 135 140 

Thr Thr Arg Ser Val Gin Asn Lys Leu Phe Glu Gin Pro Glu Phe Gly 
145 150 155 160 

His Tyr Thr Ser He Ala Lys Gin Val Leu Leu Ala Leu Glu Gin Asp 
165 170 175 

Asn Phe Cys Asp Phe Glu lie Gin Tyr Glu He Ala His Asn Tyr He 
180 185 190 

His Ala Leu Val Gly Gly Ala Gin Pro Tyr Gly Met Ala Ser Leu Arg 
195 .200 205 

Tyr Thr Ala Phe Asp Pro Leu Phe Tyr Leu His His Ser Asn Thr Asp 
210 215 220 

.Arg He Trp Ala He Trp Gin Ala Leu Gin Lys Tyr Arg Gly Lys Pro 
1225 230 235 240 

Tyr Asn Val Ala Asn Cys Ala Val Thr Ser Met Arg Glu Pro Leu Gin 
245 250 255 

Pro Phe Gly Leu Ser Ala Asn He Asn Thr Asp His Val Thr Lys Glu 
260 265 270 

His Ser Val Pro Phe Asn Val Phe Asp Tyr Lys Thr Asn Phe Asn Tyr 
275 280 * 285 

Glu Tyr Asp Thr Leu Glu Phe Asn Gly Leu Ser He Ser Gin Leu Asn 
290 295 300 

Lys Lys Leu Glu Ala He Lys Ser Gin Asp Arg Phe Phe Ala Gly Phe 
305 310 315 320 

Leu Leu Ser Gly Phe Lys Lys Ser Ser Leu Val Ly.q Php A tn Tie. Cys 

325 330 335 

Thr Asp Ser Ser Asn Cys His Pro Ala Gly Glu Phe Tyr Leu Leu Gly 
340 345 350 

V Asp Glu Asn Glu Met Pro Trp Ala Tyr Asp Arg Val Phe Lys Tyr Asp 
355 360 365 

He Thr Glu Lys Leu His Asp Leu Lys Leu His Ala Glu Asp His Phe 
370 375 . 380 

Tyr He Asp Tyr Glu Val Phe Asp Leu Lys Pro Ala Ser Leu Gly Lys 
385 390 395 400 

Asp Leu Phe Lys Gin Pro Ser Val He His Glu Pro Arg He 
4 05 410 



<210> 42 

<211> 411 

<212> PRT 

" <213> Megathura crenulata 

<220> 

<223> KLHl-d 



66 



<400> 42 

Glv His His Glu Gly Giu Val Tyr Gin Ala Glu Val Thr Ser Ala Asn 
1 5 10 15 

Ara lie Arg Lys Asn He Glu Asn Leu Ser Leu Gly Glu Leu Glu Ser 
20 25 .30 

Leu Arg Ala Ala Phe Leu Glu He Glu Asn Asp Gly Thr Tyr Glu Ser 
35 40 45 

He Ala Lys Phe His Gly Ser Pro Gly Leu Cys Gin Leu Asn Gly Asn 
50 55 60 

Pro He Ser Cys Cys Val His Gly Met Pro Thr Phe Pro His Trp His 
65 70 75 80 

Arg Leu Tyr Val Val Val Val Glu Asn Ala Leu Leu Lys Lys Gly Ser 
85 90 95 

Ser Val Ala Val Pro Tyr Trp Asp Trp Thr Lys Arg lie Glu His Leu 
100 105 HO 

izo His Leu He Ser Asp Ala Thr Tyr Tyr Asn Ser Arg Gin His His 
115 120 125 

Tvr Glu Thr Asn Pro Phe His His Gly Lys He Thr His Glu Asn Glu 
130 135 140 

He Thr Thr Arg Asp Pro Lvs Asp Ser Leu Phe His Ser Asp Tyr Phe 
!45 150 155 160 

Tvr Glu Gin Val Leu Tyr Ala Leu Glu Gin Asp Asn Phe Cys Asp Phe 
165 170 .175 

Glu He Gin Leu Glu He Leu His Asn Ala Leu His Ser Leu Leu Gly 
180 I 85 I 90 

Glv Lys Gly Lys Tyr Ser Met Ser Asn Leu Asp Tyr Ala Ala Phe Asp 
19 5 200 205 

Pro Val Phe Phe Leu His His Ala Thr Thr Asp Arg He Trp Ala He 
210 215 220 

Gin Asp Leu Gin Arg Phe Arg Lys Arg Pro Tyr Arg Glu Ala Asn 
230 235 240 

Cys Ala He Gin Leu Met His Thr Pro Leu Gin Pro Phe Asp Lys Ser 
245 250 255 

Asp Asn Asn Asp Glu Ala Thr Lys Thr His Ala Thr Pro His Asp Gly 
260 265 270 

Phe Glu Tyr Gin Asn Ser Phe Gly Tyr Ala Tyr Asp Asn Leu Glu. Leu 
275 280 285 

Asn His Tyr Ser He Pro Gin Leu Asp His Met Leu Gin Glu Arg Lys 
290 295 300 

Arg His Asp Arg Val Phe Ala Gly Phe Leu Leu His Asn He Gly Thr 
305 310 315 320 

•Ser Ala Asp Gly His Val Phe Val Cys Leu Pro Thr Gly Glu His Thr 
325 330 " 335 

Lys Asp Cys Ser His Glu Ala Gly Met Phe Ser He Leu Gly Gly Gin 
34O 345 350 



67 



Thr Glu Met Ser Phe Val Phe Asp Arg Leu Tyr Lys Leu Asp He Thr 
355 360 365 

Lys Ala Leu Lys Lys Asn Gly Val His Leu Gin Gly Asp Phe Asp Leu 
370 375 380 

Glu lie Glu He Thr Ala Val Asn Gly Ser His Leu Asp Ser His Val 
385 390 395 400 

He His Ser Pro Thr He Leu Phe Glu Ala Gly 
405 410 



<210> 43 
<211> 111 
<212> PRT 

<213> Megathura crenulata 
<22 0> 

<223> KLHl-e 
l<400> 43 

*Asp Ser Ala His Thr Asp Asp Gly His Thr Glu Pro Val Met lie Arg 
5 10 15 

Lys Asp He Thr Gin Leu Asp Lys Arg Gin Gin Leu Ser Leu Val Lys 
20 25 30 

Ala Leu Glu Ser Met Lys Ala Asp His Ser Ser Asp Gly Phe Gin Ala 
35 40 45 

He Ala Ser Phe His Ala Leu Pro Pro Leu Cys Pro Ser Pro Ala Ala 
50 55 60 

Ser Lys Arg Phe Ala Cys Cys Val His Gly Met Pro Thr Phe Pro Gin 
65 70 .75 . 80 

Trp His Arg Leu Tyr Thr Val Gin Phe Gin Asp Ser Leu Arg Lys His 

as : 

Gly Ala Val Val Gly Leu Pro Tyr Trp Asp Trp Thr Leu Pro Arg 
100 105 110 



<210> 44 
<211> 317 
<212> PRT 

<213> Megathura crenulata 
<220> 

<223> KLH2-b 
<400> 44 

Gly Leu Pro Tyr Trp Asp Trp Thr Met Pro Met Ser His Leu Pro Glu 



Leu Ala Thr Ser Glu Thr Tyr Leu Asp Pro Val Thr Gly Glu Thr Lys 
20 25 30 

Asn Asn Pro Phe His His Ala Gin Val Ala Phe Glu As.n Gly Val Thr 
35 40 45 

Ser Arg Asn Pro Asp Ala Lys Leu Phe Met Lys Pro Thr Tyr Gly Asp 
50 55 60 



68 



His Thr Tyr 
65 



Phe Cys Asp 
Ala Trp Val 



Thr Ala Phe 
115 



Leu Trp Ala 
130 



Lys Ala His 
145 



Ala Phe Ser 
^Val Pro Thr 



r Asp Asp Leu 
195 



lie His Lys 
210 



Ser Tyr lie 
225 



Gly His Asp 
Lys Glu Met 



Leu Phe Asp Ser Met lie Tyr Ala Phe Glu Gin Glu Asp 
70 75 80 



Phe Glu Val Gin 
85 



Gly Gly Ser Glu 
100 



Asp Pro lie Phe 



lie Trp Gin Ala 
135 



Tyr Glu Leu Thr His Asn Ala lie His 
90 95 



Lys Tyr Ser Met Ser Ser Leu His Tyr 
105 110 



Tyr Leu His His Ser Asn Val Asp Arg 
120- 125 



Leu Gin lie Arg Arg Gly Lys Ser Tyr 
140 



Cys Ala Ser Se 
150 . 



Gin Glu Arg Glu Pro Leu Lys Pro Phe 
155 160 



Ser Pro Leu Asn 
165 



Asn Val Tyr Asp 
180 



Gin Phe Gly Gly 



Gin Thr Gin His 
215 



Gly Thr Ser Ala 
230 



Lys Tyr Lys Val 
245 



Lys Trp Gly Phe 
260 



Asn Asn Glu Lys Thr Tyr His Asn Ser 
170 175 



Tyr Val Gly Val Leu His Tyr Arg Tyr 
185 ' 190 



Met Thr Met Ser Glu Leu Glu Glu Tyr' 
200 205 



Asp Arg Thr Phe Ala Gly Phe Phe Leu 
220 



Ser Val Asp He Phe He Asn Arg Glu 
235 240 



Gly Ser Phe Val Val Leu Gly Gly Ser 

250 - 255 



Asp Arg Met Tyr Lys Tyr Glu He Thr 
265 270 



Glu Ala Leu Lys Thr Leu Asn Val Ala Val Asp Asp Gly Phe Ser He 
- ; 280 285 



-2T5~ 



Thr Val Glu 
290 



file Pro Pro 

305 



He Thr Asp Val 
295 



Pro Ala He He 
310 



Asp Gly Ser Pro Pro Ser Ala Asp Leu 
300 



Phe Glu Arg Gly His Ala 
315 



<210> 45 
<211> 411 
<212> PRT 

<213> Megathura crenulata 

<220> 

<223> KLH2-C 
<400> 45 

Asp Ala Lys Asp Phe Gly His Ser Arg Lys He Arg Lys Ala Val Asp 
1 5 10 15 

Ser Leu Thr Val Glu Glu Gin Thr Ser Leu Arg Arg Ala Met Ala Asp 
20 25 - 30 

Leu Gin Asp Asp Lys Thr Ser Gly Gly Phe Gin Gin He Ala Ala Phe 



His Gly Glu Pro Lys Trp Cys Pro Ser Pro Glu Ala Glu Lys Lys Phe 
50 55 60 

Ala Cys Cys Val His Gly Met Ala Val Phe Pro His Trp His Arg Leu 
65 70 75 80 

Leu Thr Val Gin Gly Glu Asn Ala Leu Arg Lys His Gly Phe Thr Gly 
85 90 95 

Gly Leu Pro Tyr Trp Asp Trp Thr Arg Ser Met Ser Ala Leu Pro His 
100 105 110 

Phe Val Ala Asp Pro Thr Tyr Asn Asp Ala lie Ser Ser Gin Glu Glu 
115 120 125 

Asp Asn Pro Trp His His Gly His He Asp Ser Val Gly His Asp Thr 
130 135 140 

Thr Arg Asp Val Arg Asp Asp Leu Tyr Gin Ser Pro Gly Phe Gly His 
145 150 155 160 

Tyr Thr Asp He Ala Glri Gin Val Leu Leu Ala Phe Glu Gin Asp Ser 
165 170 175 

Phe Cys Asp Phe Glu Val Gin Phe Glu He Ala His Asn Phe He His 
180 185 190 

Ala Leu He Gly Gly Asn Glu Pro Tyr Ser Met Ser Ser Leu Arg Tyr 
195 200 • 205 

Thr Thr Tyr Asp Pro He Phe Phe Leu His His Ser Ser Thr Asp Arg 
210 215 220 

Leu Trp Ala He Trp Gin Ala Leu Gin Lys Tyr Arg Gly ' Lys Pro Tyr 
225 230 235 240 

Asn Thr Ala Asn Cys Ala He Ala Ser Met Arg Lys Pro Leu Gin Pro 
245 250 " 255 



Phe Gly Leu Asp Ser Val He Asn Pro Asp Asp Glu Thr Arg Glu His 
260 265 270 



er Val Pro Phe Arg Val Phe Asp Tyr Lys Asn Asn Phe Asp Tyr Glu 
275 280 285 



Tyr Glu Ser Leu Ala Phe Asn Gly Leu Ser He Ala Gin Leu Asp Arg 
290 29.5 300 



Glu Leu Gin Arg Arg Lys Ser His Asp Arg Val Phe Ala Gly Phe Leu 
305 310 315 320 

Leu His Glu He Gly Gin Ser Ala Lys His Asn Val Ser Asp Cys Asp 

325 330 335 

His Tyr Ala Gly Glu Phe Tyr He Leu Gly Asp Glu Ala Glu Met Pro 
340 345 350 

Trp Arg Tyr Asp Arg Val Tyr Lys Tyr Glu He Thr Gin Gin Leu His 
355 360 365 

'•Asp Leu Asp Leu His Val Gly Asp Asn Phe Phe Leu Lys Tyr Glu Ala 
370 375 380 



Phe Asp Leu Asn Gly Gly Ser Leu Gly Gly Ser lie Phe Ser Gin Pro 
385 390 395 400 



70 



Ser Val He Phe Glu Pro Ala Ala Gly Met Phe 
405 410 



<210> 46 
<211> 109 
<212> PRT 

<213> Megathura crenulata 
<220> 

<223> KLH2-d 
<400> 46 



Gly^er His Gin Ala Asp Glu Tyr Arg Glu Ala Val Thr Ser Ala Ser 

His He Arg Lys Asn lie Arg Asp Leu Ser Glu Gly Glu lie Glu Ser 

.._ .20 25 

He Arg Ser Ala Phe Leu" Gin lie Gin Lys Glu Gly He Tyr Glu Asn 
35 40 45 . 

■lie. Ala Lys Phe His Gly Lys Pro Gly Leu Cys Glu His Asp Gly His 
V so 55 60 

Pro Val Ala Cys Cys Val His Gly Met Pro Thr Phe Pro His Trp His 
65 70 75 80 

Arg Leu Tyr Val Leu Gin Val Glu Asn Ala Leu Leu Glu Arg Gly Ser 

Ala Val Ala Val Pro Tyr Trp Asp Trp Thr Leu Pro Arg 
100 i° 5 



<210> 47 
<211> 329 
<212> PRT 

<213> Megathura crenulata 



<220> 

<223> KLH2-g 

r M et°Ala 7 Val Phe Pro His Trp His Arg Leu Phe Val Lys Gin Met Glu 

Asp Ala Leu Ala Ala His Gly Ala His lie Gly He Pro Tyr Trp Asp 

20 25 JU 

Trp Thr Ser Ala Phe Ser His Leu Pro Ala Leu Val Thr Asp His Glu 

35 40 45 

Asn Asn Pro Phe His His Gly His He Gly His Leu Asn Val Asp Thr 



50 



Ser Arg Ser Pro Arg Asp Met Leu Phe Asn Asp Pro Glu Gin Gly Ser 



65 



Glu Ser Phe Phe Tyr Arg Gin Val Leu Leu Thr Leu Glu Gin Thr As 



Phe Cys Gin Phe Glu Val Gin Phe Glu Leu Thr His Asn Ala He His 
100 105 1 



Ser Trp Thr Gly 
115 



His Thr Pro Tyr Gly Met Ser^ffr Leu Glu Tyr 



1 



Thr Ala Tyr Asp Pro Leu Phe Tyr Leu His His Ser Asn Thr Asp Arg 
130 135 140 

lie Trp Ala lie Trp Gin Ala Leu Gin Lys Tyr Arg Gly Leu Pro Tyr 
145 150 155 " " 160 

Asn Ala Ala His Cys Asp lie Gin Val Leu Lys Gin Pro Leu Lys Pro 
165 170 175 

Phe Ser Glu Ser Arg Asn Pro Asn Pro Val Thr Arg Ala Asn Ser Arg 
180 185 190 

Ala Val Asp Ser Phe Asp Tyr Glu Lys Phe Asn Tyr Gin Tyr Asp Thr 
195 200 205 

Leu Thr Phe His Gly Leu Ser lie Pro Glu Leu Asp Ala Met Leu Gin 
210 215 220 

Glu Arg Lys Lys Glu Glu Arg Thr Phe Ala Ala Phe Leu Leu His Gly 
\. 225 230 235 240 

' Phe Gly Ala Ser Ala Asp Val Ser Phe Asp Val Cys Thr Pro Asp Gly 
245 250 255 

His Cys Ala Phe Ala Gly Thr Phe Ala Val Leu Gly Gly Glu Leu Glu 
260 265 270 

Met Pro Trp Ser Phe Glu Arg Leu Phe Arg Tyr Asp lie Thr Lys Val 
275 280 285 

Leu Lys Gin Met Asn Leu His Tyr Asp Ser Glu Phe His Phe Glu Leu 
290 295 300 



Lys lie Val Gly Thr Asp Gly Thr Glu Leu Pro Ser Asp Arg lie Lys 
305 310 315 * 320 

Ser Pro Thr He Glu His His Gly Gly 
325 




<210> 48 
}<211> 103 
<212> PRT 

<213> Megathura crenulata 



<220> 

<223> KLH2-h 
<400> 48 

Gly His Asp His Ser Glu Arg His Asp Gly Phe Phe Arg Lys Glu Val 
15 10 15 

Gly Ser Leu Ser Leu Asp Glu Ala Asn Asp Leu Lys Asn Ala Leu Tyr 
20 25 30 

Lys Leu Gin Asn Asp Gin Gly Pro Asn Gly Tyr Glu Ser He Ala Gly 
35 40 45 

Tyr His Gly Tyr Pro Phe Leu Cys Pro Glu His Gly Glu Asp Gin Tyr 
50 55 60 

Ala Cys Cys Val His Gly Met Pro Val Phe Pro His Trp His Arg Leu 
65 70 75 80 



His Thr He Gin Phe Glu Arg Ala Leu Lys Glu His Gly Ser His Leu 
85 90 95 



Gly Leu Pro Tyr Trp Asp Trp 
100 



Patentanspriiche 



1 . Nukleinsaure-Molekul, umfassend eine fur ein Hamocyanin, eine Hamocyanin- 
Domane oder ein funktionelles Fragment davon mit den immunologischen Eigenschaf- 
ten wenigstens einer Domane eines Hamocyanins kodierende Nukleinsauresequenz, 
wobei die Nukleinsauresequenz ausgewahlt ist aus 

(a) der Gruppe der nachfolgend angegebenen DNA-Sequenzen bzw. der ihnen ent- 
sprechenden RNA-Sequenzen: 

in SEQ ID NO:1 (HtH1 Domane a + Signalpeptid), 

SEQ ID NO:2 (HtH1 Domane b), 

SEQ ID NO:3 (HtH1 Domane c), 

SEQ ID NO:4 (HtH1 Domane d), 

SEQ ID NO:5 (HtH1 Domane e), 

SEQ ID NO:6 (HtH1 Domane f), 

SEQ ID NO:7 (HtH1 Domane g), 

SEQ ID NO: 8 (HtH1 Domane h), 

SEQ ID NO:9 (partielle HtH2 Domane b), 

sfq in NO10 (HtH? Domane c), 

ID NO: 11 (HtH2 Domane d), 
ID NO:12 (HtH2 Domane e), 
ID NO:13(HtH2 Domane f), 
ID NO: 14 (HtH2 Domane g), 
ID NO:15(HtH2 Domane h), 
ID NO: 16 (partielle KLH1 Domane b), 
ID NO:17(KLH1 Domane c), 
ID NO:18 (KLH1 Domane d), 
ID NO: 19 (partielle KLH1 Domane e), 
ID NO:20 (KLH2 Domane b), 
ID NO:21 (KLH2 Domane c), 
ID NO:22 (partielle KLH2 Domane d), 



SEQ 
SEQ 
SEQ 
SEQ 
SEQ 
SEQ 
SEQ 
SEQ 
SEQ 
SEQ 
SEQ 
SEQ 



74 



SEQ ID NO:23 (KLH2 Domane g), 

SEQ ID NO:24 (partielle KLH2 Domane h); 

(b) Nukleinsauresequenzen, die mit dem Gegenstrang einer Nukleinsauresequenz 
nach (a) hybridisieren und fur ein Polypeptid kodieren, das die immunologischen Ei- 
genschaften wenigstens einer Domane eines Hamocyanins aufweist; 

Nukleinsauresequenzen, die aufgrund des genetischen Codes zu den unter (a) und 
(b) definierten DNA-Sequenzen degeneriert sind und fur ein Polypeptid kodieren, 
das die immunologischen Eigenschaften wenigstens einer Domane eines Ha- 
mocyanins aufweist; 

Nukleinsauresequenzen, die mit einer der unter (a) bis (c) angegebenen Nuklein- 
sauresequenzen hybridisieren und deren Gegenstrang fur ein Polypeptid kodiert, 
das die immunologischen Eigenschaften wenigstens einer Domane eines Ha- 
mocyanins aufweist; 

Nukleinsauresequenzen, die wenigstens 60 % homolog zu einer der unter (a) ange- 
gebenen Nukleinsauresequenzen sind; 

-ff) — Varianton dor untor (a) bis (d) angcgobonon Soquonzon, woboi dio Varianton go - 
genuber den unter (a) bis (d) angegebenen Sequenzen Additionen, Deletionen, In- 
sertionen oder Inversionen aufweisen und fur ein Polypeptid kodieren, das die im- 
munologischen Eigenschaften wenigstens einer Domane von Hamocyanin aufweist; 
und 

(g) Kombinationen mehrerer der unter (a) bis (f) angegebenen DNA-Sequenzen. 

2. Nukleinsauremolekul gemaE Anspruch 1 , dadurch gekennzeichnet, dafc die unter 
(b) oder (d) angegebene Hybridisierung unter stringenten Bedingungen durchgefuhrt 
wird. 
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3. Nukleinsauremolekul gemaft Anspruch 1, dadurch gekennzeichnet, daft das unter 
(e) angegebene Nukleinsauremolekul wenigstens 80 % homolog zu einer der unter (a) 
angegebenen Nukleinsauresequenzen ist. 



4. Nukleinsauremolekul gemafi Anspruch 1 , dadurch gekennzeichnet, dafc das unter 
(e) angegebene Nukleinsauremolekul wenigstens 90 % homolog zu einer der unter (a) 
angegebenen Nukleinsauresequenzen ist. 



5. Nukleinsauremolekul gemalJ Anspruch 1, dadurch gekennzeichnet, daB das unter 
(e) angegebene Nukleinsauremolekul wenigstens 95 % homolog zu einer der unter (a) 
angegebenen Nukleinsauresequenzen ist. 

6. Nukleinsauremolekul gemaft einem der Anspruche 1 bis 5, dadurch gekennzeich- 
net, dafc es ein Desoxyribonukleinsauremolekul ist. 



7. Konstrukt, umfassend ein Nukleinsauremolekul gemafc einem der Anspruche 1 bis 6. 



8. Konstrukt gemalS Anspruch 7, weiterhin umfassend einen zur Expressionskontrolle 
geeigneten Promotor, wobei die fur ein Hamocyanin, eine Hamocyanin-Domane oder 
oin funktionoll e s Fragm e nt davon kodierende Nukle i ns a uresequenz unter der Kontrolle 
des Promotors steht. 

9. Konstrukt gemaG Anspruch 7 oder 8, weiterhin umfassend eine fur ein Antigen kodie- 
rende Nukleinsauresequenz, die direkt mit der fur ein Hamocyanin, eine Hamocyanin- 
Domane oder ein funktionelles Fragment davon kodierenden Nukleinsauresequenz ver- 
bunden ist. 



10. Konstrukt gemaB Anspruch 9, wobei das Antigen ausgewahlt ist aus: Tumorantige- 
nen, Virusantigenen und Antigenen bakterieller oder parasitarer Pathogene. 
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11. Konstrukt gemalS einem der Anspruche 7 bis 10, wobei das Konstrukt wenigstens 
einen Teil eines Vektors enthalt, wobei der Vektor ausgewahlt ist aus: Bakteriophagen, 
Adenoviren, Vacciniaviren, Bacuioviren, SV40-Virus und Retroviren. 

12. Konstnjkt gemaft einem der Anspruche 7 bis 1 1, wobei das Konstrukt weiterhin eine 
His-Tag-kodierende Nukleinsauresequenz umfafct und die Expression des Konstrukts 
zur Bildung eines Fusionsproteins mit einem His-Tag fuhrt. 



13. Wirtszelle, enthaltend ein Konstrukt gemaft einem der Anspruche 7 bis 12, wobei die 
Wirtszelle eine zur Expression des Konstrukts geeignete prokaryontische oder eu- 
karyontische Zelle ist. 

14. Wirtszelle gemaG Anspruch 13, dadurch gekennzeichnet, daft die prokaryontische 
Wirtszelle ausgewahlt ist aus E. coli und Bacillus subtilis . 



15. Wirtszelle gemafc Anspruch 13, dadurch gekennzeichnet, daft die eukaryontische 
Wirtszelle ausgewahlt ist aus Hefezellen, Insektenzellen und Saugerzellen, bevorzugt 
aus CHO-Zellen, COS-Zellen und HeLa-Zellen. 



1(=i N/flrfahrpn 71 im HprstPllPn Pinps Hamnr.yanin-PnlypRptidps w ohai das Nukleinsau- 

remolekQI gemali einem der Anspruche 1 bis 6 und/oder das Konstrukt gemafJ einem 
der Anspruche 7 bis 12 in einer geeigneten Wirtszelle exprimiert wird und das Protein 
gegebenenfalls isoliert wird. 

17. Verfahren gemafi Anspruch 16, dadurch gekennzeichnet, dad das hergestellte 
Hamocyanin-Polypeptid naturlich oder chemisch modifiziert wird. 



18. Verfahren gemaft Anspruch 17, dadurch gekennzeichnet, daft die Modifikation ei- 
ne Quervernetzung oder eine kovalente Bindung an ein Antigen ist. 
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19. Verfahren gemaft einem der Anspruche 16 bis 18, dadurch gekennzeichnet, daft 
die Expression in einer Wirtszelle gemafl einem der Anspruche 13 bis 15 durchgefuhrt 
wird. 



20. Hamocyanin-Polypeptid, umfassend eine Aminosauresequenz, die von einem Oder 
mehreren der Nukleinsauremolekule nach einem der Anspruche 1 bis 6 kodiert wird. 



21. Hamocyanin-Polypeptid gemaG Anspruch 20, umfassend wenigstens eine aus der 
folgenden Gruppe ausgewahlte Aminosauresequenz: 

SEQ ID NO:25 (HtH1 Domane a + Signalpeptid), 

SEQ ID NO:26 (HtH1 Domane b), 

SEQ ID NO:27 (HtH1 Domane c), 

SEQ ID NO:28 (HtH1 Domane d), 

SEQ ID NO:29 (HtH1 Domane e), 

SEQ ID NO:30 (HtH1 Domane f), 

SEQ ID NO:31 (HtH1 Domane g), 

SEQ ID NO:32 (HtH1 Domane h), 

SEQ ID NO:33 (partielle HtH2 Domane b), 

SEQ ID NQ;3 4 (HtH 2 Domanp r . ) , 

SEQ ID NO:35 (HtH2 Domane d), 
SEQ ID NO:36 (HtH2 Domane e), 
SEQ ID NO:37 (HtH2 Domane f), 
SEQ ID NO:38 (HtH2 DSmane g), 
SEQ ID NO:39 (HtH2 Domane h), 
SEQ ID NO:40 (partielle KLH1 Domane b), 
SEQ ID NO:41 (KLH1 Domane c), 
SEQ ID NO:42 (partielle KLH1 Domane d), 
SEQ ID NO:43 (partielle KLH1 Domane e), 
SEQ ID NO:44 (KLH2 Domane b), 
SEQ ID NO:45 (KLH2 Domane c), 
SEQ ID NO:46 (partielle KLH2 Domane d), 
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SEQ ID NO:47 (KLH2 Domane g), 

SEQ ID NO:48 (partielle KLH2 Domane h), 

oder ein Fragment einer dieser Sequenzen, das die immunologischen Eigenschaften 
wenigstens einer Domane eines Hamocyanins autweist. 

22. Rekombinantes Hamocyanin-Polypeptid, erhaltlich durch das Verfahren gemafl ei- 
nem der AnsprOche 16 bis 19 oder Modifikationen davon. 

• 23. Rekombinantes Hamocyanin-Polypeptid gemafc Anspruch 22, dadurch gekenn- 
zeichnet, daft es die Sequenzen SEQ ID NO: 25 bis 32 umfaftt und Hamocyanin 1 aus 
Haliotis tuberculata ist. 

24. Rekombinantes Hamocyanin-Polypeptid gemaft Anspruch 22, dadurch gekenn- 
zeichnet, daft es die Sequenzen SEQ ID NO: 33 bis 39 umfaftt und Hamocyanin 2 aus 
Haliotis tuberculata ist. 

25. Rekombinantes Hamocyanin-Polypeptid gemaft Anspruch 23, dadurch gekenn- 
zeichnet, daft es ein scheinbares Molekulargewicht von 370 KDa in SDS-PAGE unter 

r e duz ie r e ndon Bod i ngungon aufwo i st. — _ 

26. Rekombinantes Hamocyanin-Polypeptid gemaS Anspruch 24, dadurch gekenn- 
zeichnet, da(S es ein scheinbares Molekulargewicht von 370 KDa in SDS-PAGE unter 
reduzierenden Bedingungen aufweist. 

27. Rekombinantes Hamocyanin-Polypeptid gemad Anspruch 21 , dadurch gekenn- 
zeichnet, daft das Hamocyanin-Polypeptid die Sequenzen SEQ ID NO: 40 bis 43 um- 
faftt und KLH1 aus Megathura crenulata ist. 

28. Rekombinantes Hamocyanin-Polypeptid gemafl Anspruch 21, dadurch gekenn- 
zeichnet, dad das Hamocyanin-Polypeptid die Sequenzen SEQ ID NO: 44 bis 48 um- 
faftt und KLH2 aus Megathura crenulata ist. 
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29. Rekombinantes Hamocyanin-Polypeptid gema(l einem der Anspruche 20 bis 28, 
dadurch gekennzeichnet, dali es kovalent an Viren, Virenbestandteile, Bakterien, 
Bakterienbestandteile, DNA, DNA-Bestandteile, anorganische oder organische Molekule 
wie z. B. Kohlenhydrate Peptide und/oder Glykoproteine gebunden ist. 

30. Rekombinantes Hamocyanin-Polypeptid gemaB einem der Anspruche 20 bis 29, 
dadurch gekennzeichnet, da(3 das Hamocyanin-Polypeptid nicht-glykosyliert ist. 



• 31. Rekombinantes Hamocyanin-Polypeptid gemafc einem der Anspruche 20 bis 29, 
dadurch gekennzeichnet, daB das Hamocyanin-Polypeptid glykosyliert ist. 

32. Pharmazeutische Zusammensetzung, enthaltend ein Nukleinsauremolekul gemaft 
einem der Anspruche 1 bis 6 und/oder ein Konstrukt gemafc einem der Anspruche 7 bis 
12 und physiologisch vertragliche Zusatzmittel. 



33. Pharmazeutische Zusammensetzung gemalS Anspruch 32, dadurch gekennzeich- 
net, daft sie zur gentherapeutischen Behandlung von Tumoren verwendet wird. 



34. Pharmazeutischo Zusammonsotzung, onthaltond ein Hamocyanin - Polyp e ptid nach — 
einem der Anspruche 20 bis 31 und physiologisch vertragliche Zusatzmittel. 

35. Pharmazeutische Zusammensetzung gemaft Anspruch 34, dadurch gekennzeich- 
net, daft sie als Antiparasitenmittel, Antivirusmittel oder als Antitumormittel verwendet 
wird. 

36. Pharmazeutische Zusammensetzung nach Anspruch 34, dadurch gekennzeichnet, 
daft sie zum Behandeln einer der folgenden Erkrankungen verwendet wird: Schistoso- 
miasis, Bluthochdruck, Oberflachen-Harnblasenkarzinomen, Epithelkarzinomen, Ovari- 
alkarzinom, Mammakarzinom, Bronchialkarzinom und Kolonrektalkarzinom. 



37. Pharmazeutische Zusammensetzung nach Anspruch 34, dadurch gekennzeichnet, 
da& sie als Impfstoff verwendet wird. 



38. Pharmazeutische Zusammensetzung gemafc Anspruch 34, dadurch gekennzeich- 
net, daft sie zur Kokain-MiGbrauchsvorsorge verwendet wird. 



39. Verwendung von Hamocyanin-Polypeptid gemafc einem der Anspriiche 20 bis 31 als 
Tragerstoff fiir Arzneimittel. 



40. Liposom, umfassend ein Nukleinsauremolekul gemafi einem der Ansprtiche 1 bis 6, 
ein Konstrukt gemaft einem der Anspriiche 7 bis 12 und/oder ein Hamocyanin- 
Polypeptid gemafJ einem der Anspriiche 20 bis 31. 

41 . Liposom gemafi Anspruch 40, dadurch gekennzeichnet, dafi das Liposom weiter- 
hin Zellerkennungsmolekiile umfaftt. 



42. Antikorper, erhaltlich durch Immunisieren eines Versuchstieres mit dem rekombinan- 
ten Hamocyanin-Polypeptid gemafc einem der Anspruche 20 bis 31 . 

43. Screening-Verfahren zum Identifizieren von Tumor-spezifischer DNA in einer Zelle 
umfassend: 

a) das Inkontaktbringen zellularer DNA und/oder zellularen Proteins mit einer Sonde 




umfassend die Nukleinsauresequenz gemafi einem der Anspriiche 1 bis 6 und/oder 
des Antikorpers gemaG Anspruch 42 und 



b) das Nachweisen der spezifischen Bindung. 



44. Screening-Verfahren gemafc Anspruch 43, dadurch gekennzeichnet, dali der 
nachzuweisende Tumor Harnblasenkarzinom, Epithelialkarzinom, Ovarialkarzinom, 
Mammakarzinom, Bronchialkarzinom oder Kolonrektalkarzinom ist. 



Zusammenfassung 



Nukleinsauremolekul, umfassend eine fur ein 
Hamocyanin kodierende Nukleinsauresequenz 

Die vorliegende Erfindung betrifft ein Nukleinsauremolekul, umfassend eine far ein Ha- 
mocyanin, eine Hamocyanin-Domane Oder ein Fragment mit den immunologischen Ei- 
genschaften wenigstens einer Domane von Hamocyanin kodierende Nukleinsaurese- 
quenz. 

• Weiterhin betrifft die Erfindung Konstrukte, die das Nukleinsauremolekul und gegebe- 
nenfalls einen zur Expressionskontrolle geeigneten Promotor enthalten. In einer bevor- 
zugten Ausfuhrungsform enthalt das Konstrukt ferner eine fur ein Antigen kodierende 
Nukleinsauresequenz. Die Erfindung betrifft aufierdem Wirtszellen, die diese Nuklein- 
sauremolekule und/oder Konstrukte enthalten. Die Erfindung betrifft ferner die rekombi- 
nante Expression der Nukleinsauremolekule und/oder Konstrukte in den Wirtszellen. 
Weiterhin betrifft die Erfindung Hamocyanin, eine Hamocyanin-Domane, ein Fragment 
mit den immunologischen Eigenschaften wenigstens einer Domane von Hamocyanin 
und Hamocyanin-Fusionsproteine, die von den NukleinsauremolekUlen und/oder Kon- 
strukten kodiert werden. Die Erfindung betrifft weiterhin pharmazeutische Zusammen- 
setzungen, die die Nukleinsauremolekule und/oder Hamocyanin, eine Hamocyanin- 

• Domane, ein Fragment davon Oder ein Fusionsprotein, enthalten. Weiterhin betrifft die 
Erfindung Liposomen, die die Nuleinsauremolekuhle und/oder Hamocyanin, eine Ha- 
mocyanin-Domane, ein Fragment davon Oder ein Fusionsprotein, enthalten. Ferner be- 
trifft die Erfindung Antikorper, die durch Immunisieren eines Versuchstieres mit dem 
Hamocyanin, einer Hamocyanin-Domane, einem Fragment davon oder einem Fusions- 
protein, erhaitlich sind, und deren Verwendung in Screening-Verfahren zum Identifizie- 
ren von Tumoren. 
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Fig. 1 
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Fig. 2 
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Fig. 3 
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Figur 4 

cDNA-Sequenz in Verbindung mit Intronstruktur des HtHl 
Domane a 

GGCTTGTTCAGTTTCTACTCGTCGCCCTTGTGGCGGGGGCTGGAGCAGACAACGTCGTCAG 
AAAGGACGTGAGTCACCTCACGGATGACGAGGTGCAAGCTCTCCACGGCGCCCTCCATGAC 
G T C AC T G CAT C TAC AG G GC C T C T GAG T T T C GAAG AC AT AAC AT C T T AC CAT G C C G C AC C AG 
CGTCGTGTGACTACAAGGGACGGAAGATCGCCTGCTGTGTCCACGGTATGCCCAGTTTCCC 
CTTCTGGCACAGGGCATATGTCGTCCAAGCCGAGCGGGCACTGTTGTCCAAACGGAAGACT 
GTCGGAATGCCTTACTGGGACTGGACGCAAACGCTGACTCACTTACCATCTCTTGTGACTG 
AACCCATCTACATTGACAGTAAAGGTGGAAAGGCTCAAACCAACTACTGGTACCGCGGCGA 
GATAGCGTTCATCAATAAGAAGACTGCGCGAGCTGTAGATGATCGCCTATTCGAGAAGGTG 
GAGCCTGGTCACTACACACATCTTATGGAGACTGTCCTCGACGCTCTCGAACAGGACGAAT 
TCTGTAAATTTGAAATCCAGTTCGAGTTGGCTCATAATGCTATCCATTACTTGGTTGGCGG 
TAAATTTGAATATTCAATGTCAAACTTGGAATACACCTCCTACGACCCCATCTTCTTCCTC 
CACCACTCCAACGTTGACCGCCTCTTCGCCATCTGGCAGCGTCTTCAGGAACTGCGAGGAA 
AGAATCCCAATGCAATGGACTGTGCACATGAACTCGCTCACCAGCAACTCCAACCCTTCAA 
CAGG GAC AG CAAT C CAG T C C AG C T C AC AAAG GAC C AC T C G AC AC C T G C T G AC C T C T T T GAT 
TAC AAAC AAC T T G GAT AC AG C TAC GAC AG C T TAAAC C T GAAT G G AAT GAC G C CAGAAC AG C 
TGAAAACAGAACTAGACGAACGCCACTCCAAAGAACGTGCGTTTGCAAGCTTCCGACTCAG 
TGGCTTTGGGGGTTCTGCCAACGTTGTTGTCTATGCATGTGTCCCTGATGATGATCCACGC 
AGTGATGACTACTGCGAGAAAGCAGGCGACTTCTTCATTCTTGGGGGTCAAAGCGAAATGC 
C G T G GAG AT T C TAC AG AC CCTTCTTCTATGATG T AAC T GAAG C G G TAC AT C AC C T T G G AG T 
CCCGCTAAGTGGCCACTACTATGTGAAAACAGAACTCTTCAGCGTGAATGGCACAGCACTT 
TCACCTGATCTTCTTCCTCAACCAACTGTTGCCTACCGACCTGGGAAAG 



Domane b 

GTCACCTTGACCCACCTGTGCATCATCGCCACGATGACGATCTTATTGTTCGAAAAAATAT 
AG AT CAT T T GAC T C G T GAAG AG GAAT AC GAG C T AAG GAT G G C T C T G GAG AG AT T C CAG G C C 
GACACATCCGTTGATGGGTACCAGGCTACAGTAGAGTACCATGGCCTTCCTGCTCGTTGTC 
CACGACCAGATCCAAAAGTCAGGTTCGCCTGTT6TATGCATGGCATGGCATCCTTCCCTCA 
CTGGCACCGGCTGTTCGTTACCCAGGTGGAAGATGCTCTTGTACGGCGTGGATCGCCTATC 
GGTGTTCCTTATTGGGACTGGACAAAACCTATGACTCACCTTCCAGACTTGGCATCAAATG 
i AGAC G TAC G T AGAC C C G TAT G GAC AT AC AC AT CAT AAT C CAT T C T T C AAT GC AAATAT AT C 
) TT T T GAG GAG GGACAC CAT C AC AC GAG CAG GAT GATAGAT T C GAAAC TGTTTGCCC CAG T C 
GCTTTTGGGGAGCATTCCCATCTGTTTGATGGAATCCTGTACGCATTTGAGCAGGAAGATT 
TCTGCGACTTTGAGATTCAGTTTGAGTTAGTCCATAATTCTATTCATGCGTGGATAGGCGG 
TTCCGAAGATTACTCCATGGCCACCCTGCATTACACAGCCTTTGACCCCATTTTCTACCTT 
CATCATTCCAATGTCGATCGTCTATGGGCAATCTGGCAAGCTCTTCAAATCAGGAGACACA 
AGCCATATCAAGCCCACTGTGCACAGTCTGTGGAACAGTTGCCAATGAAGCCATTTGCTTT 
C C CAT C AC C T C T T AAC AAC AAC GAG AAG AC AC AT AG T CAT T CAG T C CC G AC T G ACAT T TAT 
GACTACGAGGAAGTGCTGCACTACAGCTACGATGATCTAACGTTTGGTGGGATGAACCTTG 
AAG AAAT AG AAG AAG C TAT AC AT C T CAG AC AAC AG CAT G AAC GAG TCTTCGCGG GAT T T C T 
CCTTGCTGGAATAGGAACATCTGCACTTGTTGACATTTTCATAAATAAACCGGGGAACCAA 
CCACTCAAAGCTGGAGATATTGCCATTCTTGGTGGTGCCAAGGAAATGCCTTGGGCGTTTG 
ACCGCTTGTATAAGGTCGAAATAACTGACTCATTGAAGACACTTTCTCTCGATGTCGATGG 
AGAT TAT GAAG T C AC T T T TAAAAT T CAT GAT AT G C AC G GAAAC G C T C T T GAT AC G GAC C T G 
ATTCCACACGCAGCAGTTGTTTCTGAGCCAGCTCACC 
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Intron b/c 

GTAAGTAAATTTACAAAATTTGGTGTTCTCTAACTATCCTAAGTATTCAATCGTTAGCGTG 
T AC C TAT C T G C AT AAT G C AAT AC C C T G AC T C C AT ATAAG TAT AG TAT AT T T AC TCTGGTCG 
AAAACAAACAAATTGAAAACAAGAGTGGACGTGCTGTTATGATTTCTTTTTCATTCTTGGT 
TCGTTGTG T AAT G C C AC AG C C AG C AAT T C C AG AT AT AT AG C G AC G G T C TAT G AAT AC T C C A 
GTCTGGACCAGACAATCGTGTGGAATGGTTTAGGCACATTATATCAAATTCATTGTTGAAG 
ATATGAGTTATGAGGTCACAATGTTGTCTTGTTACCCCGTGTCAGTAGTGACGTCATTTCA 
T GAC T G AAAT C T C T T C AAC G C C G T T TAG C AAT AAT AG GC T C AG TAG TAT T C AAC C AAT T AC 
AATCAGTAGAAAATTCTCTATACTATTCTTATGTTGCATCCTGATATCCCTATGCAAAAAT 
TAG T CAT C T AAT AT AAT CAT T T T C GAT AAA! AC T T T G G G C AAAC AAAT C AAT G T AAC AT C T 
ATTTTCTTTCAG 



Domane c 

C T AC C T T T GAG GAT G AAAAG C AC AG C T T AC G AAT C AGAAAAAAT G T C GAC AG C T T GAC T C C 
TGAAGAAACAAATGAACTGCGTAAAGCCCTGGAGCTTCTTGAAAATGATCATACTGCAGGT 
GGATTCAATCAGCTTGGCGCCTTCCATGGAGAGCCTAAATGGTGCCCTAATCCTGAAGCGG 
\ AGCACAAGGTTGCATGCTGTGTTCATGGCATGGCTGTTTTCCCTCATTGGCACAGGCTTCT 
TGCTCTCCAGGCGGAGAATGCTCTTAGAAAGCATGGGTACAGTGGTGCTCTACCATACTGG 
GATTGGACTCGCCCCCTTTCCCAACTTCCTGATCTGGTTAGTCATGAGCAGTATACAGATC 
C T T C C GAC CAT C AC G T GAAG CAT AAC CCGTGGTT C AAT G G C CAC AT C GAT AC AG T AAAT CA 
G GAT AC C AC C AGAAG C G T AC G G G AGG AT C T T TAT C AAC AAC C T G AAT T T G GAC AT T T C AC G 
GATATTGCTCAACAAGTCCTCTTAGCATTAGAACAAGATGACTTCTGTTCGTTTGAAGTGC 
AGTATGAGATTTCCCATAATTTTATCCATGCACTTGTAGGAGGAACCGACGCTTATGGCAT 
GGCAT C G C T GAGATATACAG CAT AC GAT C C AAT CTTTTTCTTG CAT CAT T CAAACAC C GAC 
AG GAT C T G G G C TAT T T G G C AAT C C C T G C AAAAAT AC AG AG G C AAAC C GT AC AAC AC T G C C A 
ACTGCGCCATAGAATCTATGAGAAGGCCCCTGCAACCATTTGGACTAAGCAGTGCCATTAA 
C C C T GAC AG AAT CAC C AG AG AG CAT G C TAT C C C G T T T GAT G T C T T C AAC TAT AG AG AT AAC 
CTTCATTACGTATATGATACCCTGGAATTTAATGGTTTGTCGATTTCACAACTTGATAGAG 
AGCTGGAAAAAATCAAGAGTCACGAAAGAGTATTTGCTGGATTCTTGCTGTCGGGGATTAA 
AAAATCTGCTCTTGTGAAATTCGAAGTTTGTACTCCACCTGATAATTGTCATAAAGCAGGG 
GAGTTTTATCTACTCGGGGACGAAAACGAGATGGCTTGGGCCTATGACCGACTTTTCAAGT 
ATnATATTArTrAGGTTCTGGAA^CAAACCATCTACArTTrTATnATCATCTCTTCATTCG 
CTACGAAGTCTTTGATCTTAAAGGAGTGAGTTTGGGAACTGACCTGTTCCACACTGCAAAT 
GTGGTACATGATTCCGGCACAG 

| Intron c/d 

G TAC G T G GAT T T GAT T ACAT AGC AAT G C TAT AT GAT T T C AG T AAT T AC AAC CT CAAG T CAT 
GTAGCCGTTTTAGATTGCATTACATCAAACAGCATTGGATTAAATTGGGGGATTGTCCAGG 
CCGCATTATGTTGCATTCCGAAAATAGTTTGTGTCCAGTGTCCACGTTTAAAATTAAACCA 
T T T T AAT CAT AT TAG G GAT AAT T T T AAT AG AT GTTATAGTGCTT TAT T T CAT AT T G T TAC A 
G T G GAC AG T CAC CAAG GAC AT AT T T TAC T C T AT AGAT AC AC AAAC AC C AAT T AAAAC C C T G 
CTTTGGAAAGTCTAACTTTTTCCCCACAG 



Domane d 

GCACCCGTGATCGTGATAACTACGTTGAAGAAGTTACTGGGGCCAGTCATATCAGGAAGAA 
TTTGAACGACCTCAATACCGGAGAAATGGAAAGCCTTAGAGCTGCTTTCCTGCATATTCAG 
GACGACGGAACATATGAATCTATTGCCCAGTACCATGGCAAACCAGGCAAATGTCAATTGA 
ATGATCATAATATTGCGTGTTGTGTCCATGGTATGCCTACCTTCCCCCAGTGGCACAGACT 
GTATGTGGTTCAGGTGGAGAATGCTCTCCTAAACAGGGGATCTGGTGTGGCTGTTCCTTAC 
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TGGGAGTGGACTGCTCCCATAGACCATCTACCTCATTTCATTGATGATGCAACATACTTCA 
ATTCCCGACAACAGCGGTACGACCCTAACCCTTTCTTCAGGGGAAAGGTTACTTTTGAAAA 
C G C AG T C AC AAC AAG G G AC C C AC AAG C CGGGCTCTT C AAC T C AG AT TAT AT G TAT G AG AAT 
GTTTTACTTGCACTGGAGCAGGAAAATTATTGTGACTTTGAAATTCAGTTTGAG.CTTGTTC 
ATAACGCACTTCATTCCATGCTGGGAGGTAAAGGGCAGTACTCCATGTCCTCCCTGGACTA 
TTCTGCGTTTGATCCCGTCTTCTTCCTACATCATGCCAACACGGACAGACTGTGGGCAATC 
T GG C AG GAAC T AC AAAGAT T C C GAGAAC T G C C T TAT GAAG AAG C GAAC T G T G C AAT C AAC C 
T CAT G CAT CAAC CAC T GAAG C C G T T C AG T GAT C C AC AT GAG AAT C AC GAC AAT G T C AC T T T 
G AAAT AC T C AAAAC C AC AG GAC G GAT T C GAC T AC C AG AAC C AC T T C G G ATAC AAG TAT GAC 
AACCTTGAGTTCCATCACTTATCTATCCCAAGTCTTGATGCTACCCTGAAGCAAAGGAGAA 
ATCACGACAGAGTGTTTGCGGGCTTCCTTCTTCATAACATAGGAACTTCTGCTGACATAAC 
TATCTACATATGTCTGCCTGACGGACGGCGTGGCAATGACTGCAGTCATGAGGCGGGAACA 
TTCTATATCCTCGGAGGCGAAACAGAGATGCCTTTTATCTTTGACCGTTTGTATAAATTTG 
AAATCACCAAACCACTGCAACAGTTAGGAGTCAAGCTGCATGGTGGAGTTTTCGAACTGGA 
GCTTGAGATCAAGGCATACAACGGTTCCTATCTGGATCCCCATACCTTTGATCCAACTATC 
ATCTTTGAACCTGGAACAG 

Intron d/e 

G T AAT G C C AT C T T AAT AC AG TTCGTTCGT T AAAT TAT AT AT G T T C G T T T AC AAC AC CAT AC 
CTTGAATTGAGGTAATACATCACTTGATATTGATAATGTAATGGTAATTGTTCTTGTTTGT 
AAAACCGTTTCTGGGGTGTTTATTCACTATCCACCTGGTGGATAGTGAGTAAACACATTCG 
GTTTAATATGGGTATCTAATGGACAGTGAAGTGTGCTGGCTAGGCAGATACCTTGGTTTCT 
GTGAATGGAGGTAGTAGAAAGGGGTTTTGATGATTGCAG 



Domane e 

ATAC C CAT AT C T T GG AC CAC GAC CAT GAGGAAGAG AT AC T T G T CAG GAAG AAT AT AAT T GA 
TTTGAGCCCAAGGGAGAGGGTTTCTCTAGTCAAAGCTTTGCAAAGAATGAAGAATGATCGC 
TCCGCTGATGGGTACCAAGCCATTGCCTCTTTCCATGCCCTGCCACCACTCTGTCCCAATC 
CATCTGCAGCTCACCGTTATGCTTGCTGTGTCCATGGCATGGCTACATTTCCCCAGTGGCA 
CAGACTGTACACTGTTCAGGTTCAGGATGCCCTGAGGAGACATGGTTCACTTGTTGGTATT 
CCTTACTGGGACTGGACAAAACCAGTCAACGAGTTACCCGAGCTTCTTTCTTCAGCAACAT 
TTTATCATCCAATCCGGAATATTAATATTTCAAATCCATTCCTCGGGGCTGACATAGAATT 
TGAAGGACCGGGCGTTCATACAGAGAGGCACATAAATACTGAGCGCCTGTTTCACAGTGGG 
GATCATGACGGATACCACAACTGGTTCTTCGAAACTGTTCTCTTTGCTTTGGAACAGGAAG 
AT T AC T G C GAT T T T G AAAT ACAAT T T GAGAT AG C CC AT AAT G G C AT CCAC AC AT GGAT T GG 
1 TGGAAGCGCAGTATATGGCATGGGACACCTTCACTATGCATCATATGATCCAATTTTCTAC 
AT C CAC CAT T C AC AGAC GGAC AG AAT AT G G G C T AT T T GG C AAGAG C T GCAGAAGT AC AGG G 
GTCTATCTGGTTCGGAAGCAAACTGTGCCATTGAACATATGAGAACACCCTTGAAGCCTTT 
CAG CTTTGGGC CAC C C T AC AAT T T GAAT AG T C ATAC G CAAG AAT AT T C AAAG C C T GAG GAC 
AC G T T T GAC T AT AAGAAG T T T G G ATAC AG AT AT GAT AG T C T G G AAT T G GAG G G GC GAT C AA 
TT T C T C G CAT T GAT GAAC T TAT C CAG C AGAGACAG GAG AAAG AC AG AAC T T T T GC AG G G T T 
CCTCCTTAAAGGTTTTGGTACATCCGCATCTGTGTCATTGCAAGTTTGCAGAGTTGATCAC 
ACCTGTAAAGATGCGGGCTATTTCACTATTCTGGGAGGATCAGCCGAAATGCCATGGGCAT 
T C GAC AG G C T T TAT AAG TAT GAC AT TAC T AAAAC T C T T CAC GACAT GAAC C T GAG G CAC G A 
GG ACAC T T T C T C TAT AG AC G T AAC TAT CAC G T C T T AC AAT G GAAC AG T AC T C T C G G GAG AC 
CTCATTCAGACGCCCTCCATTATATTTGTACCTGGACGCC 

Intron e/f 

G T G AG T AC C T G T T T G C AC T AAG AC T T C T G T AG G C T AAAAG T G T AAG AAAT AT C AAT T AAT T 
TCAATTCACCCAAACTTGAAAACGGTACCTATATAGGTTAACTTTTTGTCTACAGTAAACT 
GAAC AT AC C TAC AC AT T T C AT G AAAT GAT C T C T C AAT AT T T T C CAC CAAC AG 



Domane f 



ATAAAC T CAAC T CAC G GAAAC AT AC AC C T AAC AGAGT C C G C CAT GAG C T AAG TAG C C T TAG 
T T C C C G T GAC AT AG C AAGC T T G AAG G C AG C T T T G AC AAG C C T T CAAC AT G AT AAT G G G AC T 
GATGGTTATCAAGCTATTGCTGCCTTCCATGGCGTTCCTGCGCAGTGCCACGAGCCATCTG 
GACGTGAG 



Intron f(l) 



G TAAAT T TACAG AG C T TTAT GAAG T G T G T T C AGAG T GAAGAG AC C AAG ATATAC T TAT AC C 
C AAAAC TAG C TAG CAAC AG AC GAT T T CAC TTGTTTCG GAC AC T T T G TAT TAT AC G T T G GAT 
CCCAAGGTAAACGGAAACGTAACCGAGAATCAGTCCGTAAAGTGAGTGAGTGAGTTTGGGG 
CTTAACGTCGCACTCAGCAATACCCCAGCTATGTGGCGACTCTCAGATTTACTGCTGGAGG 
AGAACCTACATAGCCCGGTTTAACCCGTGTGGTATGTAGTAAGACCAGCGCGGCATGGCTG 
GTATCTGACGGACGAAGGGTGGCGCTGCACGTATTCCAGTGGTACAACACTGCACCCCAAT 
TTCACCGACCGGAGAACTGATCTCCCCTTCGGAGATATCGCCTGCCTTCCACGGGATTCGA 
ACTCGGTGACCTTCAAGCCAGCGCGCTTCTAGCGGGGGCGATTAGAGGTTNAAGGCCGACG 
GCTCTACCACCTTAACTATCCCCCGGCCCCACTCCTGACGGAAATGTTTATAATTCAGCCT 
| ■pTQ'j'p'j'TCT TAT T AAACAC T C T T G G CAGAT T T T C T AT AGAT AAT G GAT T CAC AT G T AGAC A 
GTCTCCCATTGTTGTAACTGGTAGTCAAGAGTTAGAATCTGAATACATTCTCCAAGATGGA 
T CAAG GAAAACAAT AAT T AC T T GAT G T T G CAG 



Domane f ( 2 ) 



ATCGCCTGTTGCATCCACGGCATGGCGACGTTTCCTCACTGGCACCGGTTGTACACTCTGC 
AGTTGGAGCAAGCGCTGCGCAGACACGGGTCCAGTGTTGCTGTTCCATACTGGGACTGGAC 
C AAG C C AAT CAC C G AAC T G C CAC AC AT T C T GAC AG AC G GAG AAT AT TAT GAC G T T T G G C AA 
AATGCCGTCTTGGCCAATCCGTTTGCAAGAGGTTATGTGAAAATTAAAGATGCATTTACGG 
TGAGAAATGTCCAGGAAAGTCTGTTCAAAATGTCAAGTTTTGGAAAGCACTCGCTTCTGTT 
TGACCAGGCTTTGTTGGCTCTTGAACAAACTGACTACTGTGACTTCGAAGTTCAGTTTGAA 
GTGATGCATAACACGATCCATTATCTCGTAGGAGGGCGTCAAACGTACGCCTTCTCCTCTC 
TCGAGTATTCCTCATACGATCCAATCTTCTTTATTCACCACTCGTTTGTTGACAAAATATG 
G G C T G TAT G G C AAG AAC T G C AAAG CAG GAG AC AT C TACAG T T TAG AAC AG C T GAT T G T G C T 
GTGGGCCTCATGGGTCAGGCAATGAGGCCTTTCAACAAGGATTTCAACCACAACTCGTTCA 
C C AAG AAG CAC G CAG T C C C T AAT AC AG TAT T T GAT TAT GAAG AT C T T G G C TAT AAC TAT G A 
C AAC C T T G AAAT CAGTGGTT T AAAC T TAAAT GAG AT C GAG G C G T T AAT AG C AAAAC G C AAG 
! TCACATGCTAGAGTCTTTGCTGGGTTCCTGTTGTTTGGATTAGGAACTTCGGCTGATATAC 
ATCTGGAAATTTGCAAGACATCGGAAAACTGCCATGATGCTGGTGTGATTTTCATCCTTGG 
AG G T T C T G CAG AG AT G CAT T G G G CAT AC AAC C G C C T C T AC AAG TAT GAC AT TACAG AAG C A 
TTGCAGGAATTTGACATCAACCCTGAAGATGTTTTCCATGCTGATGAACCATTTTTCCTGA 
GGCTGTCGGTTGTTGCTGTGAATGGAACTGTCATTCCATCGTCTCATCTTCACCAGCCAAC 
GAT AAT C TAT GAAC CAG GC GAAG 



Intron f/g 



GTGAGATATATGCAAATTGAATGTTGTCCAGATGCGTTGTTTACATTTATATGCTTGGAAT 
T G T C C T GAAC G AAT AC AG T G GAAT AAC C AAAAG C T G AAAAAT AAAAA.G AT AT AT AC T T CAT 
TCTGAATTTGTCAGTATTGCTGACCCAAAAACACGTTATCCATGTCGACACTATATTTGCC 
TTTCTGAATCTGAGACTGCGTTATGTTTCTAATAATCACGAAATATGGTATACAGGTTGTG 
T AT C T G TAG AAT AC C C AAG G CAG AAT T T AAAG G G T CAC AC C C T G T T T AAT AC AG 
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Domane g ( 1 ) 

ATCACCATGACGACCATCAGTCGGGAAGCATAGCAGGATCCGGGGTCCGCAAGGACGTGAA 
CACCTTGACTAAGGCTGAGACCGACAACCTGAGGGAGGCGCTGTGGGGTGTCATGGCAGAC 
CACGGTCCCAATGGCTTTCAAGCTATTGCTGCTTTCCATGGAAAACCAGCTTTGTGTCCCA 
TGCCTGATGGCCACAACTACTCATGTTGTACTCACGGCATGGCTACCTTCCCACACTGGCA 
TCGCCTCTACACCAAGCAGATGGAGGATGCAATGAGGGCGCATGGGTCTCATGTCGGCCTG 
CCCTACTGGGACTGGACTGCTGCCTTCACCCACCTGCCAACACTGGTCACCGACACGGACA 
AC AAC C C C T T C C AAC AT 

Intron g(2) 

GTAAGAGCGGGGTAGGGATGGGGTGGTAGGGGGTGGGTTGTTCTATTACTTCCCGCTTCAC 
TTGTATGAAATGGATAACCTTGGCTGCATCCCAATTGCGTGATCGATTCTCTTTCGATTCA 
CTCGTGCGATTAGACTGCCTTATTTACTATAGTAGTTAGAATGTTGCTCAGTGCGCCGTTA 
AAC AAC TAAT AC AC AAAAC C G CAT T T G T T T TAT AT G G T C AC T C T AC T G T T TAT C AC G TATA 
TGTATGTTCCGACTCACTGGTTGGTGCGTACCATTCTACTGTCACACTGAGAGCCAATGTT 
C T C AG AT G T G T G AAAT G T T T G AAAG C C G T T T C T AC AT AAT AT T G C AG G AAT AC CAT T G T AG 
AATGTAGTCAAACAGGTAACAATCTGTTAGTGAGCCCAGTTCGAGGTTGCGTTGTAGGGTG 
TAG T C CAAC AG G TAGG C AG T C C ATAAG CAT AG T T T T T AAG CAT T T TAGAT CAT C TAT AAT T 
AAC C AC AT G G T TAG CCGCTATGTTTAGTT TAAT C C AG T AT AAG T TAG AAC T G T TAT AT T T C 
GAAGGGAAGTGAGTAAATCCTTATTCCTTGACTACCATTTAATAGATTTCCCAATGACTCC 
ATTCAACTCCTAACTTTCACATCACTGCTCTCTTCAACAG 



Domane g(2) 

G G AC AC AT T GAT TAT C T C AAT G T C AG C AC AAC T C GAT C T C C C C G AG ACAT G C T G T T CAAC G 
ACCCCGAGCATGGATCAGAGTCGTTCTTCTACAGACAAGTCCTCTTAGCTCTGGAACAAAC 
TGATTTCTGCAAATTCGAAGTTCAGTTTGAGATAACCCACAATGCCATCCATTCCTGGACA 
GGTGGCCACAGCCCCTACGGAATGTCCACTCTCGACTTCACTGCCTACGATCCTCTCTTCT 
GGCTTCACCACTCCAACACCGACAGAATCTGGGCTGTCTGGCAAGCTTTGCAAGAATACAG 
AGGACTTCCATACAACCATGCCAATTGTGAGATCCAGGCAATGAAAACGCCCCTGAGGCCT 
TTCAGT G AC GAT AT CAAC C AC AAC C C AC T CACAAAC G C T AAC C C CAAC C CAT TAGAT GTGT 
T C G AG TAT AAT C G G T T GAG C T T C C AG T AC G AC AAC CTCATCTTC CAT G GAT AC AG TAT T C C 
GGAACTTGATCGCGTGCTTGAAGAAAGAAAGGAGGAGGACAGAATATTTGCTGCCTTCCTT 
C T CAGT GGAAT C AAG C GT AG T G C T GAT G TAG T G T T C GAC AT AT G C C AG C CAG AACAC GAAT 
GTGTGTTCGCAGGGACTTTTGCGATTTTGGGAGGGGAGCTAGAAATGCCCTGGTCCTTCGA 
CAG AC TGTTCCGC TAT GAT AT C AC C AAG G T GAT G AAG CAGCTACACCT GAG G CAT G AC T C T 
GACTTTACCTTCAGGGTGAAGATTGTCGGCACCGACGACCACGAGCTTCCTTCAGACAGTG 
TCAAAGCACCAAC TAT T GAAT TTGAACCGGGCG 

Intron g/h 

GTGAGTACGACAGGCATTTCTAGTAAAAACCTACTTTTGGTAAAAGGTTCGAGAAATCACT 
T GAAG CAAC AAC AT GAT T T T G TAAC G C C TAT T AC AC G T G AAC AT G T C AC AC C CG G T GAT G C 
CGTTTAATGGACATGCCTCTGTTAATGAAAGGGGTAAGTACATGTGTATGGGGATGGGATG 
GGAGCCACCTGTCCCAATTTCATAGGTCCCTAGGATCCCAGTTGCGTAGGAATCCCCTGAT 
TAATGCCTTGTGAATTCCTCCTGGAATTGTCCTGGCCCAAATTTTTACAAACCCGCCCCGA 
TATACCTTGGAAATAATTGGGCCTAAGGGTGGGGCTTTTAAGGACCAAGAACCCAACCTAA 
ACCCCAACCCATTTTTTCCCACCCATTCCAGGTTTTGTTTTACCAAATAAAAAGGTTTCCA 
CTTTGAGGAAACCCTTTAAGGGTTCTTTTCAGGGCTTTTTTTCTTTTCTGGGAATTCCAAT 
T C C G G G G G AAC AAAAT AC AT AT AT T T C AC AG AC C T T T G G T C AAAT T TAT AT AAT T T C C GAC 
TTCATGTCATAGGTTTGTCTTTCTTCCTACACAG 



Domane h 
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TGCACAGAGGCGGAAACCACGAAGATGAACACCATGATGACAGACTCGCAGATGTCCTGAT 
CAGGAAAGAAGTTGACTTCCTCTCCCTGCAAGAGGCCAACGCAATTAAGGATGCACTGTAC 
AAGCTCCAGAATGACGACAGTAAAGGGGGCTTTGAGGCCATAGCTGGCTATCACGGGTATC 
CTAATATGTGTCCAGAAAGAGGTACCGACAAGTATCCCTGCTGTGTCCACGGAATGCCCGT 
GTTCCCCCACTGGCACCGCCTGCATACCATTCAGATGGAGAGAGCTCTGAAAAACCATGGC 
TCTCCAATGGGCATTCCTTACTGGGATTGGACAAAGAAGATGTCGAGTCTTCCATCTTTCT 
TTGGAGATTCCAGCAACAACAACCCTTTCTACAAATATTACATCCGGGGCGTGCAGCACGA 
AAC AAC C AG G GAC AT T AAT C AG AG AC T C T T T AAT C AAAC C AAG T T T G G T G AAT T T GAT T AC 
CTATATTACCTAACTCTGCAAGTCCTGGAGGAAAACTCGTACTGTGACTTTGAAGTTCAGT 
ATGAGATCCTCCATAACGCCGTCCACTCCTGGCTTGGAGGAACTGGAAAGTATTCCATGTC 
TACCCTGGAGCATTCGGCCTTTGACCCTGTCTTCATGATTCACCACTCGAGTTTGGATAGA 
ATCTGGATCCTTTGGCAGAAGTTGCAAAAGATAAGAATGAAGCCTTACTACGCATTGGATT 
GTGCTGGCGACAGACTTATGAAAGACCCCCTGCATCCCTTCAACTACGAAACCGTTAATGA 
AG AT G AAT T C AC C C G CAT C AAC T C T T T C C C AAG CAT AC TGTTTGAC C AC T AC AG G T T C AAC 
TAT G AAT AC GAT AAC AT GAGAAT C AG G G G T C AG GAC AT AC AT G AAC T T G AAGAG G T AAT T C 
AGGAATTAAGAAACAAAGATCGCATATTTGCTGGTTTTGTTTTGTCGGGCTTACGGATATC 
AG C T AC AG T G AAAG TAT T CAT T C AT T C GAAAAAC GAT AC AAG T C AC G AAG AAT AT G C AG G A 
GAATTTGCAGTTTTGGGAGGTGAGAAGGAGATGCCGTGGGCATATGAAAGAATGCTGAAAT 
T G GAC AT C T C C GAT G C T G T AC AC AAG CTTCACGT G AAAG AT G AAG AC AT C C G T T T TAG AG T 
GGTTGTTACTGCCTACAACGGTGACGTTGTTACCACCAGGCTGTCTCAGCCATTCATCGTC 
CACCGTCCAGCCCATGTGGCTCACGACATCTTGGTAATCCCAGTAGGTGCGGGCCATGACC 
TTCCGCCTAAAGTCGTAGTAAAGAGCGGCACCAAAGTCGAGTTTACACCAATAGATTCGTC 
GGTGAACAAAGCAATGGTGGAGCTGGGCAGCTATACTGCTATGGCTAAATGCATCGTTCCC 
CCTTTCTCTTACCACGGCTTTGAACTGGACAAAGTCTACAGCGTCGATCACGGAGACTACT 
ACATTGCTGCAGGTACCCACGCGTTGTGTGAGCAGAACCTCAGGCTCCACATCCACGTGGA 
ACACGAGTAG 



3'UTR 
TTCACAG 

Intron UTH : 

GTGAGGAGAAGGCCCCAGGCTAGCAGGGCAATGGATGAAGGAAATAGGGGCAAAGGGAATA 

• GC AG T T AC AC CAT C GAC AT T T C C AAC C T C C T CAGAAAC TAAT AT AT AG C C T T AAT AC AAC C 
AGCCAAGACTCAACGGGCAGCCGGGGTGGGGGGATTTGGTGGTCGCTGTTTCAGACCAGGG 
T G C AAAATAT C AG T G C G C AAAT C AAC AT GTTGCGTGT C AGAC AC T GAC ACAG CAG T CAT T G 
AAC C T G C AG AC C CAT AAC AG G AAAAT G G G G C AG AT AC GAT C AAAG AC AG T G T AAAAT AG G G 
ATAAGTAGGCATATGCAACCACCTGATGGAAATGAAAAGGGGTAAGTTTAAACCCCGGCTA 
CCAAAGGTCCAATGGTTCCTTAACCCAGCTTACGCTATCCCTCTAATTTCAGTATTGAGCT 
GATTTCTGTCGAGTTCATGTAAACTGTATACTTTCTGTATTATTACAG 

3 ' UTR 

GTTGCTATGCCGACTGCGCTATATTGGTGAACGAGACGATGAGGACATCTCTGAAAGAGTT 
C G C C AAG T GAT GT G T AG G T C AC G G AAG TAT T G T T GAG C T AAC AAT AT GAT GAT T T C AAAAT 
GACTTGGCGCTCTAGGACAAAGACATAATTCATCAGCACCCTGTGCACCAACTCTTTGTTT 
GCTGCAAACGTCTGACAAGCGACACGTCAATCAACAAGCTGTTCAAACTCAAGTGGATGTA 
AC T AGAAT CGTTGGGC CAT C G T T C AC AAAG TAT T GAC AG AT G T C AC AC AT GAT G G C G AG AA 
AC AC T T TAGAAC T T T TAAT GAC C T AGAG T GAC T T G T AAAT AT G T AAAT AT AT T C T T C AAAG 
AC T C AG C T G AAC T AT T G T T G G AT AAC AC AT C AAT T C C C T C AAC AAAAT GC T T T AT C T T C AC 
AT G GAT G T AT GT AAT GTGGCCGG C AAT AA^G TAT AT AT AT G T AT AAAAAAAAAAAAAAAAA 
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Figur 5 



Abgeleitete Primarstruktur des HtHl 



Signalpeptid 
LVQFLLVALVAGAGA 



Domane a 



DNWRKDVSHLTDDEVQALHGALHDVTASTGPLSFEDITSYHAAPASCDYKGRKIACCVHG 
MPSFPFWHRAYWQAERALLSKRKTVGMPYWDWTQTLTHLPSLVTEPIYIDSKGGKAQTNY- 
WYRGEIAFINKKTARAVDDRLFEKVEPGHYTHLMETVLDALEQDEFCKFEIQFELAHNAIH 
YLVGGKFEYSMSNLEYTSYDPIFFLHHSNVDRLFAIWQRLQELRGKNPNAMDCAHELAHQQ 
LQPFNRDSNPVQLTKDHSTPADLFDYKQLGYSYDSLNLNGMTPEQLKTELDERHSKERAFA 
SFRLSGFGGSANWVYACVPDDDPRSDDYCEKAGDFFILGGQSEMPWRFYRPFFYDVTEAV 
HHLGVPLSGHYYVKTELFSVNGTALSPDLLPQPTVAYRPGK 



Domane b 

GHLDPPVHHRHDDDLIVRKNIDHLTREEEYELRMALERFQADTSVDGYQATVEYHGLPARC 
PRPDAJCVRFACCMHGMASFPHWHRLFVTQVEDAiVRRGSPIGVPYWDWTKPMTHLPDIASN 
ETYVDPYGHTHHNPFFNANISFEEGHHHTSRMIDSKLFAPVAFGEHSHLFDGILYAFEQED 
FCDFEIQFELVHNSIPiAWIGGSEDYSMATLHYTAFDPIFYLHHSWDRLWAIWQALQIRRH 
KPYQAHCAQSVEQLPMKPFAFPSPLNNNEKTHSHSVPTDIYDYEEVLHYSYDDLTFGGMNL 
EEIEEAIHLRQQHERVFAGFLLAGIGTSALVDIFINKPGNQPLKAGDIAILGGAKEMPWAF 
DRLYKVEITDSLKTLSLDVDGDYEVTFKIHDMHGNALDTDLIPHAAWSEPAH 



Domane c 



PTFEDEKHSLRIRKNVDSLTPEETNELRKALELLENDHTAGGFNQLGAFHGEPKWCPNPEA 
EHKVACCVHGMAVFPHWHRLLALQAENALRKHGYSGALPYWDWTRPLSQLPDLVSHEQYTD 
PSDHHVKHNPWFNGHIDTVNQDTTRSVREDLYQQPEFGHFTDIAQQVLLALEQDDFCSFEV 
QYEISHNFIHALVGGTDAYGMASLRYTAYDPIFFLHHSNTDRIWAIWQSLQKYRGKPYNTA 
NCAIESMRRPLQPFGLSSAINPDRITREHAIPFDVFNYRDNLHYVYDTLEFNGLSISQLDR 
ELEKIKSHERVFAGFLLSGIKKSALVKFEVCTPPDNCHKAGEFYLLGDENEMAWAYDRLFK 
YDITQVLEANHLHFYDHLFIRYEVFDLKGVSLGTDLFHTANWHDSGT 



Domane d 

GTRDRDNYVEEVTGASHIRKNLNDLNTGEMESLRAAFLHIQDDGTYESIAQYHGKPGKCQL 
NDHNIACCVHGMPTFPQWHRLYWQVENALLNRGSGVAVPYWEWTAPIDHLPHFIDDATYF 
NSRQQRYDPNPFFRGKVTFENAVTTRDPQAGLFNSDYMYENVLLALEQENYCDFEIQFELV 
HNALHSMLGGKGQY SMS SLDYSAFDPVFFLHHANTDRLWAIWQELQRFRELPYEEAN CAIN 
LMHQPLKPFSDPHENHDNVTLKYSKPQDGFDYQNHFGYKYDNLEFHHLSIPSLDATLKQRR 
NHDRVFAGFLLHNIGTSADITI YICLPDGRRGNDCSHEAGTFYILGGETEMPFI FDRLYKF 
EITKPLQQLGVKLHGGVFELELEIKAYNGS YLDPHTFDPTIIFEPGT 



Domane e 
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DTHILDHDHEEEILVRKNIIDLSPRERVSLVKALQRMKNDRSADGYQAIASFHALPPLCPN 
PSAAHRYACCVHGMATFPQWHRLYTVQVQDALRRHGSLVGIPYWDWTKPVNELPELLSSAT 
FYHPIRNINISNPFLGADIEFEGPGVHTERHINTERLFHSGDHDGYHNWFFETVLFALEQE 
DYCDFEIQFEIAHNGIHTWIGGSAVYGMGHLHYASYDPIFYIHHSQTDRIWAIWQELQKYR 
GLSGSEANCAIEHMRTPLKPFSFGPPYNLNSHTQEYSKPEDTFDYKKFGYRYDSLELEGRS 
ISRIDELIQQRQEKDRTFAGFLLKGFGTSASVSLQVCRVDHTCKDAGYFTILGGSAEMPWA 
FDRLYKYDITKTLHDMNLRHEDT'FSIDVTITSYNGTVLSGDLIQTPSIIFVPGR 



Domane f 



HKLNSRKHTPNRVRHELSSLSSRDIASLKAALTSLQHDNGTDGYQAIAAFHGVPAQCHEPS 
GREIACCIHGMATFPHWHRLYTLQLEQALRRHGSSVAVPYWDWTKPITELPHILTDGEYYD 
VWQNAVLANPFARGYVKIKDAFTVRNVQESLFKMSSFGKHSLLFDQALLALEQTDYCDFEV 
QFEVMHNTIHYLVGGRQTYAFSSLEYSSYDPIFFIHHSFVDKIWAVWQELQSRRHLQFRTA . 
DCAVGLMGQAMRPFNKDFNHNS FTKKHAVPNTVFDYEDLG YNYDNLEI SGLNLNEIEALIA 
KRKSHARVFAGFLLFGLGTSADIHLEICKTSENCHDAGVIFILGGSAEMHWAYNRLYKYDI 
TEALQEFDINPEDVFHADEPFFLRLSWAVNGTVIPSSHLHQPTII YEPGE 



Domane g 

DHHDDHQSGSIAGSGVRKDVNTLTKAETDNLREALWGVMADHGPNGFQAIAAFHGKPALCP 
MPDGHNYSCCTHGMATFPHWHRLYTKQMEDAMRAHGSHVGLPYWDWTAAFTHLPTLVTDTD 
NNPFQHGHIDYLNVSTTRSPRDMLFNDPEHGSESFFYRQVLLALEQTDFCKFEVQFEITHN 
AIHSWTGGHSPYGMSTLDFTAYDPLFWLHHSNTDRIWAVWQALQEYRGLPYNHANCEIQAM 
KTPLRPFSDDINHNPVTKANAKPLDVFEYNRLSFQYDNLIFHGYSIPELDRVLEERKEEDR 
I FAAFLLSGI KRSADWFDI CQPEHECVFAGTFAI LGGELEMPWS FDRLFRYDI TKVMKQL 
HLRHDSDFTFRVKIVGTDDHELPSDSVKAPTIEFEPG 



Domane h 



VHRGGNHEDEKHDDRLADVLIRKEVDFLSLQEANAIKDALYKLQNDDSKGGFEAIAGYHGY 

: PtJI ' lCPERGTDKYPCCWiGMPVFPHWHRLHTIQI'fflRALKI'THGSPMCIPYWDWTKKMSSLPSF 

FGDSSNNNPFYKYYIRGVQHETTRDVNQRLFNQTKFGEFDYLYYLTLQVLEENSYCDFEVQ 
YEILHNAVHSWLGGTGQYSMSTLEYSAFDPVFMIHHSSLDRIWILWQKLQKIRMKPYYALD 

• CAGDRLMKDPLHPFNYETVNEDEFTRINSFPSILFDHYRFNYEYDNMRIRGQDIHELEEVI 
QELRNKDRIFAGFVLSGLRISATVKVFIHSKNDTSHEEYAGEFAVLGGEKEMPWAYERMLK 
LDISDAVHKLHVKDEDIRFRWVTAYNGDWTTRLSQPFIVHRPAHVAHDILVIPVGAGHD 
LPPBCVVVXSGTKVEFTPIDSSWKAMVELGSYTAMAKCIVPPFSYHGFELDKVYSVDHGDY 
YIAAGTHALCEQNLRLHIHVEHE 
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Figur 6 

cDNA-Sequnz in Verbindung mit Intronstruktur des HtH2 



Domane b 



CACAGACTGTTCGTCACCCAGGTGGAAGATGCTCTGATCAGGCGAGGATCGCCTATAGGGG 
TCCCCTACTGGGACTGGACTCAGCCTATGGCGCATCTCCCAGGACTTGCAGACAACGCCAC 
C T AT AG AGAT C C CAT C AG C G G G G AC AG C AG AC AC AAC C C C T T C C AC GAT G T T G AAG T T G C C 
T T T GAAAAT G G AC G TACAG AAC G T C AC C C AGAT AG TAG AT T G T T T G AACAAC C T T TAT T T G 
GCAAACATACGCGTCTCTTCGACAGTATAGTCTATGCTTTTGAGCAGGAGGACTTCTGCGA 
TTTTGAAGTTCAATTTGAGATGACCCATAATAATATTCACGCCTGGATTGGTGGCGGCGAG 
AAGTATTCCATGTCTTCTCTACACTACACAGCCTTCGACCCTATCTTCTACCTTCGTCACT 
CCAACACTGACCGGCTCTGGGCAATTTGGCAAGCGTTGCAGATACGAAGAAACAGGCCTTA 
CAAGGCTCATTGTGCTTGGTCTGAGGAACGCCAGCCTCTCAAACCTTTCGCCTTCAGTTCC 
C C AC T G AAC AA C AAC G AAAAAAC C T AC G AAAAC TCGGTGCC C AC C AAC G T T T AC GAC T AC G 
AAGGAGTCCTTGGCTATACTTATGATGACCTCAACTTCGGGGGCATGGACCTGGGTCAGCT 
T GAG G AAT AC AT C C AG AG G C AG AG AC AG AG AGAC AG GAC CTTTGCTGGTTTCTTTCTGTCA 
CAT AT TGGTACAT C AG C G AAT G T T G AAAT CAT T AT AGAC C AT G G GAC T C T T CAT AC C T C C G 
TGGGCACGTTTGCTGTTCTTGGCGGAGAGAAGGAGATGAAATGGGGATTTGACCGTTTGTA 
C AAAT AT G AGAT TAC AGAT GAAC T GAG G C AAC T T AAT CTCCGTGCT GAT GAT G T T T T CAG C 
ATCTCTGTTAAAGTAACTGATGTTGATGGCAGTGAGCTGTCCTCTGAACTCATCCCATCTG 
CTGCTATCATCTTCGAACGAAGCCATA 



Intron b/c 



GTAAGTAGCTACCTGTTTATTCAATTTTTTCGCTTTGCCAATCAATTCATTCAGCTTGAAA 
TTCAATAATTGTGTTTTGCATGGCTGAAAACCAATTTGAACTCTTTTCTTTTCTCAGGTCG 
AAC T C AAAT AAAT AAT C AC TAAT T G T TAT G C AC G C G G G TAG G G CAT AC AT AC TAT AT C C AC 
ATCGGTCATCTCAAAATGCAAACAAATTGTCTTATTTCCGTTGGGACAAGCAAACCCCCTT 
TCCTGTAATCTTGCCTTTGGCATCCACTGGAATTAATGTTGACTGGTAATTGATACTGGCT 
CTCTTCTTGCATAGAGTTAATATCTATAGTTTGTAAATCTTTATGATTTTGCTATTTATAT 
T T C GAC AG CAT G C TAT AGAC AC C C TAG AC TAT T G TAT AG C C AC T T G TAT TGTTTTTC CAT T 
TAT TAT T TAT AAC AG AAC AT G G C T T G TAAT T T T TAT T TAC C T T C CAG 



| Domane c 

T T GAC CAT CAG GAC C C G CAT CAT GAC ACAAT CAT TAGGAAAAAT G T T GAT AAT C T TAC AC C 
CGAGGAAATTAATTCTCTGAGGCGGGCAATGGCAGACCTTCAATCAGACAAAACCGCCGGT 
GGATTCCAGCAAATTGCTGCTTTTCACGGGGAACCCAAATGGTGCCCAAGTCCCGATGCTG 
AGAAGAAGTTCTCCTGCTGTGTCCATGGAATGGCTGTCTTCCCTCACTGGCACAGACTCCT 
GACCGTGCAAGGCGAGAATGCCCTGAGAAAGCATGGATGTCTCGGAGCTCTCCCCTACTGG 
GACTGGACTCGGCCCCTGTCTCACCTACCTGATTTGGTTTTGGTAAGTAGCAGAACTACAC 
CGATGCCATATTCCACCGTGGAAGCCCGAAACCCCTGGTACAGCGGCCATATTGATACAGT 
TGGTGTTGACACAACAAGAAGCGTCCGTCAAGAACTGTATGAAGCTCCTGGATTTGGCCAT 
TATACTGGGGTCGCTAAGCAAGTGCTTCTGGCTTTGGAGCAGGATGACTTCTGTGATTTTG 
AAGTCCAGTTTGAGATAGCTCACAATTTCATTCACGCTCTTGTCGGCGGAAGCGAGCCATA 
TGGTATGGCGTCACTCCGTTACACTACTTATGATCCAATTTTCTACCTCCATCATTCTAAC 
ACT GAC AG AC T C T G G G C TAT AT G G CAG G C T C T AC AAAAG TACAG G G G C AAAC C T TAC AAT T 
CCGCCAACTGCGCCATTGCTTCTATGAGAAAACCCCTACAACCCTTTGGTCTGACTGATGA 
GATCAACCCGGATGATGAGACAAGACAGCATGCTGTTCCTTTCAGTGTCTTTGATTACAAG 
AACAACTTCAATTATGAATATGACACCCTTGACTTCAACGGACTATCAATCTCCCAGCTGG 
ACCGTGAACTGTCACGGAGAAAGTCTCATGACAGAGTATTTGCCGGATTTTTGCTGCATGG 
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TATTCAGCAGTCTGCACTAGTTAAATTCTTTGTCTGCAAATCAGATGATGACTGTGACCAC 
TATGCTGGTGAATTCTACATCCTTGGTGATGAAGCTGAAATGCCATGGGGCTATGATCGTC 
T T T AC AAAT AT GAG AT C AC T GAG C AG C T C AAT G C C C T G GAT C T AC AC AT C G GAG AT AG AT T 
CTTCATCAGATACGAAGCGTTTGATCTTCATGGTACAAGTCTTGGAAGCAACATCTTCCCC 
AAACCTTCTGTCATACATGACGAAGGGGCAG 

Intron c/d 

G T G AGAAC AT T GAT AAT AG T T C AAAT g AAG TAT AT C C GAT T C AAG C T G T C G AT AC AAG AT g 
AG AT AC AT AAT C AC AAT G T T T G TAT TAG AT AT C T C T C T T AAT T T AAT GCCGCTTT TAT C AA 
TAT T C GAG C AAT C C T T C AG C AAC AT AC AC C AGC AAAT G T T T CAT C AAC AG AC TAT AT TAT T 
TAATCTTTTAAAAATCCTTTTCTGTTGTTATAAATACTTAAAGTATCGAATTCCTTGAATG 
CGTCTTCTCTGCAGCATATAGTTAAGTTGTTGTGTTTCTCTGTCAG 



Domane d 

• G T C AC CAT C AG GCTGAC GAG TAC G AC G AAG T T G T AAC T G C T G C AAG C C AC AT C AG AAAG AA 
TTTAAAAGATCTGTCAAAGGGAGAAGTAGAGAGCCTAAGGTCTGCCTTCCTGCAACTTCAG 
AACGACGGAGTCTATGAGAATATTGCCAAGTTCCACGGCAAGCCTGGGTTGTGTGATGATA 
ACGGTCGCAAGGTTGCCTGTTGTGTCCATGGAATGCCCACCTTCCCCCAGTGGCACAGGCT 
CTATGTCCTCCAGGTGGAGAATGCTTTGCTGGAGAGAGGATCTGCCGTCTCTGTGCCATAC 
TGGGACTGGACTGAAACATTTACAGAGCTGCCATCTTTGATTGCTGAGGCTACCTATTTCA 
ATTCCCGTCAACAAACGTTTGACCCTAATCCTTTCTTCAGAGGTAAAATCAGTTTTGAGAA 
TGCTGTTACAACACGTGATCCCCAGCCTGAGCTGTACGTTAACAGGTACTACTACCAAAAC 
GTCATGTTGGTTTTTGAACAGGACAACTACTGCGACTTCGAGATACAGTTTGAGATGGTTC 
ACAATGTTCTCCATGCTTGGCTTGGTGGAAGAGCTACTTATTCTATTTCTTCTCTTGATTA 
TTCTGCATTCGACCCTGTGTTTTTCCTTCACCATGCGAACACAGATAGATTGTGGGCCATC 
T G G C AG GAG C T G C AG AG G TAC AG GAAG AAG C CAT AC AAT G AAG C G GAT T G T GC CAT T AAC C 
TAATGCGCAAACCTCTACATCCCTTCGACAACAGTGATCTCAATCATGATCCTGTAACCTT 
T AAAT AC T C AAAAC C C AC T GAT G G C T T T G AC TAC C AG AAC AAC T T T G GAT AC AAG TAT GAC 
AAC C T T GAG T T C AAT CAT T T C AG TAT T C C C AG G C T T G AAgAAAT CAT T C G t AT T AGAC AAC 
GTCAAGATCGTGTGTTTGCAGGATTCCTCCTTCACAACATTGGGACATCCGCAACTGTTGA 
GATATTCGTCTGTGTCCCTACCACCAGCGGTGAGCAAAACTGTGAAAACAAAGCCGGAACA 

TTTGCCGTACTCGGAG6AGAAACAGAGATGGCGTTTCATTTTGACACACTCTACACCTTTC 

ACAT C AG T GAAAC AC T GAG G GAC C T C G G CAT AC AGC T G G ACAG C CAT GAC T T T GAC C T CAG 
C AT C AAG AT T C AAG GAG T AAAT G GAT CCTACCTT GAT C C AC AC AT C C T G C C AGAG C C AT C C 
^^^k TTGATTTTTGTGCCTGGTTCAAGT 

^^^^r Intron d/e 

AAG AAAG T T T C AC T G T C T AAAT C T T T T T T TAT GAT AG AG G G TAG AG AAG T G GAG AC AAT G T 
GAC AAT AT AT T G AAT AAAG T T G T T T AAAAT T TAT AAC T C T CAT AAG T T CAT AT TAT G C T G A 
AGC T G TAG C CAT C TAT AAC T G T G T AAC AT G AAAT G T T AAGAC AT T AAC C T AAAT AC T T CAG 
C T GAT AAC AAAAC AAT G T T AAT AC AT AC G T C AAT G T AACAT T T T C T TAT C T T TAG G T TATA 
G C AT AAACAC T T CAG AG AT ACAG T GAC GAAAAC C T C TAT T T AAAT AT T T CAG G T 



Domane e 

TCTTTCCTGCGTCCTGATGGGCATTCAGATGACATCCTTGTGAGAAAAGAAGTGAACAGCC 
T GAC AAC C AG G GAG AC TGCATCTCT GAT CCATGCTCT GAAAAG T AT G CAG G AAGAC C AT T C 
ACCTGACGGGTTCCAAGCCATTGCCTCTTTCCATGCTCTGCCACCACTCTGCCCTTCACCA 
TCTGCAGCTCACCGTTATGCTTGCTGTGTCCACGGCATGGCTACATTTCCCCAGTGGCACA 
GAT T G TAC AC T G TAC AG T T C CAG GAT G C AC T GAG GAG AC AT G GAG C TAC G G TAG G T G TAC C 
GTATTGGGATTGGCTGCGACCGCAGTCTCACCTACCAGAGCTTGTCACCATGGAGACATAC 
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CAT GAT AT T T G GAG T AAC AGAG AT T T C C C CAAT C C T T T C T AC CAAG C CAATAT T GAG T T T G 
AAG G AGAAAAC AT T AC AAC AG AG AGAGAAG T CAT T G CAGACAAAC T T T T T G T CAAAG G T G G 
AC AC G T T T T T GAT AAAC T G G T T C T T C AAAC AAGC CAT C C T AG C G C T G AG C AG G AAAAC T AC 
TGTGACTTTGAGATTCAGTTTGAAATTCTTCACAACGGCGTTCACACGTGGGTCGGAGGCA 
GTCGTACCTACTCTATCGGACATCTTCATTACGCATTCTACGACCCTCTTTTCTACCTTCA 
C CAT T T C C AG ACAGAC C G TAT T T G g G CAAT C T G G C AAGAAC T C C AG G AAC AGAGAG GG C T C 
TCGGGTGATGAGGCTCACTGTGCTCTCGAGCAAATGAGAGAACCATTGAAGCCTTTCAGCT 
TCGGCGCTCCTTATAACTGGAATCAGCTCACACAGGATTTCTCCCGACCCGAGGACACCTT 
C G AC T AC AG G AAG T T T G G T TAT G AAT AT G AC AAT T T AG AAT T C C T G G G AAT G T C AG T T G C T 
G AAC T G GAT CAAT AC AT TAT T G AAC AT C AAG AAAAT GAT AG AG TATTCGCTGGGTTCCTGT 
TGAGTGGATTCGGAGGTTCCGCATCAGTTAATTTCCAGGTTTGTAGAGCTGATTCCACATG 
TCAGGATGCTGGGTACTTCACCGTTCTTGGTGGCAGTGCTGAGATGGCGTGGGCATTTGAC 
AG G C T T T AC AAAT AT GAC AT T AC T G AAAC T C T G G AGAAAAT G C AC C T T C GAT AT GAT GAT G 
ACTTCACAATCTCTGTCAGTCTGACCGCCAACAACGGAACTGTCCTGAGCAGCAGTCTAAT 
CCCAACACCGAGTGTCATATTCCAGCGGGGACATC 

Intron e/f 

, AAG TAG TAAAC T G C T C AGAT T G T T T T CAT AAT T AC T C C AC TAT T AAG T AAAAAG T AC TAG T 
} AAT T CAAT AG T AC T G T T C AC AG AG AAAT G T AAC AC AAT AG AC C AC AG AG T C CAT T T G T T AA 
" ACGCCTTTGGCTTGGTAAGTCTGAGGTTTTGGTGACTGATGGAAAGCTAAAATATATTTTG 
ACAG 



Domane f ( 1 ) 

GTGACATAAATACCAGGAGCATGTCACCGAACCGTGTTCGCCGTGAGCTGAGCGATCTGTC 
TGCGAGGGACCTGTCTAGTCTCAAGTCTGCTCTGCGAGACCTACAGGAGGATGATGGCCCC 
AACGGATACCAGGCTCTTGCAGCCTTCCATGGGCTACCAGCAGGCTGCCATGATAGCCGGG 
G AAAT GAG AT 

Intron f 

ATATTTAAAGTATTTTATCTTACGCATGACCCTGACCCTATTATTTTTTTAATCCTATGAT 
rr\7\ ^ r 7\ ttt a PTTar^ a r Tr^r^rT Tr^Tr: a r;r rrr A f^i^r A AAATC^C AC TGTAAAAATACACTGA 
C AG AG GAT TAG G CAT T C T T GG G AG T AC T G TAT AG T TAG T T G CAT AC AT AT TAG CGTTCCCT 
C AC T AAAAC G AAT C T C T G AAT G C T AT CAAT T AAAG AT CAT GAT G C T T T GAT T G T G T C T AC T 
G TAT T T AAAAT G G T G T T AAG AT T T G CAAT T AC AAT ATACAC AAAC AC GTTTCCTG CAT C T C 
GGAGAATGCAATCTTTCGTTGTACGCGTCTGTTTTCATATTTTTATGCATGTAGTTTGCAC 
TAC T T AG C G T C CAAT AAAT C C AT T C AC AAAAT C AC AC AAAC AAAC GAT T T TAGGAAT G T G A 
CTGTAGCTGCAACGAATATACCTGATCCTTTCTTGTTCCAGAT 

Domane f (2 ) 

CGCATGTTGCATTCACGGGATGCCGACCTTCCCCCAGTGGCACAGACTGTACACCCTGCAG 
TTGGAGATGGCTCTGAGGAGACATGGATCATCTGTCGCCATCCCCTACTGGGACTGGACAA 
AGCCTATCTCCGAACTCCCCTCGCTCTTCACCAGCCCTGAGTATTATGACCCATGGCATGA 
TGCTGTGGTAAACAACCCATTCTCCAAAGGTTTTGTCAAATTTGCAAATACCTACACAGTA 
AGAG AC C C AC AG G AGAT G C T G T T C C AG C T T T G T G AAC AT G GAG AG T CAAT C C T C TAT GAG C 
AAACTCTTCTTGCTCTTGAGCAAACCGACTACTGTGATTTTGAGGTACAGTTTGAGGTCCT 
CCATAACGTGATCCACTACCTTGTTGGTGGACGTCAGACCTACGCATTGTCTTCTCTGCAT 
TATGCCTCCTACGACCCATTCTTCTTTATACACCATTCCTTTGTGGATAAGATGTGGGTAG 
TATGGCAAGCTCTTCAAAAGAGGAGGAAACTTCCATACAAGCGAGCTGACTGTgcTGTCAA 
C C T AAT GAC TAAAC CAAT GAG G C C AT T T GAC T C C G AT AT GAAT C AG AAC C CAT T C AC AAAG 
AT G C AC G C AG T T C C C AAC AC AC T C TAT GAC TAC G AGAC AC T G T AC TAC AG C TAC GAT AAT C 
T C G AAAT AG G T G G C AG GAAT C T C G AC C AG C T T C AG G C T G AAAT T GAC AG AAG C AG AAG C C A 
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CGATCGCGTTTTTGCTGGATTCTTGCTTCGTGGAATCGGAACTTCTGCTGATGTCAGGTTT 
TGGATTTGTAGAAATGAAAATGACTGCCACAGGGGTGGAATAATTTTCATCTTAGGTGGAG 
C C AAG GAAAT G C CAT G G T CAT T T GAC AGAAAC T T C AAG T T T GAT AT C AC C CAT G T AC T C GA 
GAATGCTGGCATTAGCCCAGAGGACGTGTTTGATGCTGAGGAGCCATTTTATATCAAGGTT 
GAG AT C CAT G C T G T T AAC AAG AC CATGATACCGTCGTCTGT GAT C C C AG C C C C AAC T AT C A 
TCTATTCTCCTGGGGAAG 

Intron f/g 

G T GAGAGAAC C AG T AAT AG C T AC T G T C T AC AAAGAAT GT G T T CAT T T AAAG AC C T GAC T G T 
AGGCCGATGGCTGCTGTCATCTCCTCCGCCTCCTCCTCCTGTTCCTCCTCCGAAGGGGTCA 
GCTTCAGGTTCTCTTGCCAATATGCCAAGCAGACCTCCTGAGCAGGCAGTATATATACGTA 
AG G G AAG C AAG TAT G GAC CATCGCGCGG CAT G TAG AG AT AC AAT GAT CAGCTGTCTGCTGT 
T C C AC T C C T G T CAG AC AAT G AGAT AAACAT GAAT AC AG TAT TACT C AG C AGC GT T C CAAT T 
TTCAACCCTCGTATTTATTAAAAAAAGGAATTTTTAATATATTTTTCTCCTTGTTGAAATA 
TTTTAGTAACTGTTAATCGATATAGAGTGGAGTAGTGACGCTTTATTTCGGtTCATTCTCG 
AAACAAAAATATAATAGTCCACTGAACTCTCTTAAATTGTTTTTACAACCTTCAACTGCCA 
CAGACGTAATCCCTCACGTTATTTTGAGCTGACAACGTGTTGAATTGAGTGTGTTCCGAAT 

• T C T AAATAAGC AT G TAT AT AT T T AC G T C T CAT G C AAG T AAT AT AT G T T TAAC T GAT GAC G T 
CACTTGGTGACCACTGATTTAGTTCCTTTGTCATAATTGCAGTTTCTGTTGTCACGGGGAC 
GGTGGGGAAGCCAGGTTCCTCCTGTCACGCTGAATATCCCGTTCGAATCCCCCACATGGGT 
ACAAAGTGTGATGCCTATTTCTGGTGTCCCCCACCGTGATATTGCTGGAATAAGTGGCTTA 
AT AC CAT AT AC AC T C AC TCTATTGT C AC AC T AC T G C C AC C G G C T C AC AC C T C T GAT G C T T C 
TGTTCTATCCAG 



Domane g ( 1 ) 

GTCGCGCTGCTGACAGTGCGCACTCTGCCAACATTGCTGGCTCTGGGGTGAGGAAGGACGT 
CACGACCCTCACTGTGTCTGAGACCGAGAACCTAAGACAGGCTCTTCAAGGTGTCATCGAT 
GATACTGGTCCCAATGGTTACCAAGCAATAGCATCCTTCCACGGAAGTCCTCCAATGTGCG 
AGATGAACGGCCGCAAGGTTGCCTGTTGTGCTCACG 

Intron g(l) 

~ G T AAT T AAT G GAT G T G AAG T CAAT G T C C GAG G G TAT AAT AAG GAT T T AAAT AC T T CAG T C G 
T G T AAT AC T G TAT GAC AT G T G TAT T G GAT GGTGTAGG TAT T AC AG G T TAT AAG G C CAG T G T 

• GTGTTGGGACGGTTACTTTCCTGCACTAGTAATAAGCATTGTATTTAGCTAGCTTTTATCA 
TATAACTTTAGTTTCAGGTTTGtGGCAATTGAAATCGAAATTTTCTTTCATTTCAAGGTTA 
T C GC AC T C G T G T G TNAG AAT AG T T AC T AT G C T GC AT T GAG AAT AAC AC TAT AG T AAT AAAG 
CAT AT CAT AC AG T AAG AAT AAC AC TAT AG T AAT AAAG TAT AT CAT N CAG T AAG AAT G T CAT 
T G TAT G ATAAAT AG G T TAT C AC AC TCGTGTGTTT T AGAAT G G T T AC TAT C C C AGG AAT AAC 
CAC TAT G TAT TACAT G TAT AT TG G G CAG T G TAAG TAG TAG CAT T G TATAT TAAAT CAG TAT 
AT C G T G C T T C AAAAC AC CAG GAT AT AT G G G G TAT AC AG T G G GC AG T G T AAG T AGCAAC AT T 
G TATAT TAAAT CAG TATAT C G T AC T T C AAAAC AC CAG GAT TAT G G G G TAT AC AG T GG G CAG 
T G TAAG TAG TAG CAT T G TATAT TAAAT CAG TATAT C G T AC T T C AAAACAC C AG GAT AT AAT 
T CAG TATAT C G T G C T T C AAAAC AC CAG GAT AT AAT T C AG TATAT C G T G C T T C AAAAC AC C A 
G GAT AT AT G G GAT AT AC AG TGCGGGTTTG CAT AC AAC C T C CAC C C T T T AC AG 



Domane g(2) 

GTATGGcCTCCTTCCcACACTGGCACAGACTGTATGTGAAGCAGATGGAAGATGCCCTGGC 
TGACCACGGGTCACATATCGGCATCCCTTACTGGGACTGGACAACTGCCTTCACAGAGTTA 
CCCGCCCTTGTCACAGACTCCGAGAACAATCCCTTCCATGAG 
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Intron g(2) 

GTCAGTTTAGTCTCCTGTCTGAGCTAACGATACCAATTTCCTATTTTCGAGAACCACGATG 
AC G AG AAAAC AAG C AAT AT AG AT AT AGAT G C AG T AT AGAT CAAG T TAAT GAAT T CAT T G C T 
AT AT GTTTGCTTG T AATAAAC T T T AAG AAAAC G AGAG CAT G C AC AC AAAT G AAAC AAAC AA 
TTATGTGTTTGATAGGAATATGATATATGTATTTGGGGGCTGACGTGAGCAGGGTTGAAGG 
GAC AG T T T ACAT T G T C AG T AAC AC T G G GAG TAT T C T T T GAT C C AC AAT AT AT AG T T T C AT T 
G T G T T C AG C AG T T AC AAC T AAC AT TAT AT CAT AC AT T AC G T C G t AACAT GCTTCTTTTGTC 
CTCTTTTGCCAG 



Domane g ( 3 ) 

GGTCGCATTGATCATCTCGGTGTAACCACGTCACGTTCCCCCAGAGACATGCTGTTTAACG 
ACCCAGAGCAAGGATCAGAGTCGTTCTTCTATAGACAAGTCCTCCTGGCTTTGGAGCAGAC 
TGACTACTGCCAGTTCGAAGTCCAGTTTGAGCTGACCCACAACGCCATTCACTCCTGGACA 
GGTGGACGTAGCCCTTACGGAATGTCGACCCTCGAGTTCACAGCCTACGATCCTCTCTTCT 
GGCTTCACCACTCCAACACCGACAGAATCTGGGCTGTCTGGCAAGCACTGCAGAAATACCG 
AG GAC T C C CAT AC AAC G AAG CACACTGT G AAAT CCAGGTTCT G AAAC AG C C C T T GAG G C C A 
T T CAAC GAT GAC AT C AAC C AC AAT C C AAT C AC C AAGAC TAAT G C C AG G C C TAT C GAT T CAT 
T T GAT TAT G AGAGG t T T AAC TAT C AG TAT GAC AC C C T TAG C T T C CAT G GT AAG AG CAT C C C 
TGAACTGAATGACCTGCTCGAGGAAAGAAAAAGAGAAGAGAGAACATTTGCTGcCTTCCTT 
CTTCGTGGAATCGGTTGCAGTGCTGATGTCGTCTTTGACATCTGCCGgCCCAATGGTGACT 
GTGTCTTTGCAGGAACCTTTGCTGTGCTGGGAGGGGAGCTaGAAATGCCTTGGTCCTTCGA 
C AGAC TGTTCCGC TAT GAC AT C AC C AGAG T CAT GAAT CAGC T C CAT C T C C AG TAT GAT T CA 
GATTTCAGTTTCAGGGTGAAGCTTGTTGCCACCAATGGCACTGAGCTTTCATCAGACCTtC 
T CAAG T C AC CAAC AAT T GAAC AT GAAC T T G G 

Intron g/h 

GT AT G T TAT C T TAT CAT C AAAT G T G T GAT C AGAT AC T GGAG AC G T T T T CAT AT T AAC T T G G 
T C AG CAT TAG T T GAT GAT T T T G G T GC GAT G T T GAC GACAAG GAG T CAAG CAT T AAC AC AT T 
CAACACATCTTTAATCTGATATGAGAAGGGAATAAATTGATCCAGTATTGATGATTGAAGT 
TanATTAAr.AnTnAAA^ATATAr.nAnTTTTCATAATCGTATAAAACAGTAGCAGAATTGTA 
TCGTGAAAACTAAATGTGGGAAGGCGAACGCCAAGCAGATTTTAGATTACGATCGTGTGCT 
AGAATAATTCACAATAACCCAGACGTCGGAAATGTGGTTGTCTATGGCAATGGTTACGATT 
AAT T G C T AAC AT G C AC GAT T T AC C TAT T T C AG 

I 

Domane h 

AG C C C AC AG AGG AC C AG T T G AAGAAAC AG AAG T C AC T C G C CAAC AT AC T GAC G G C AAT G C A 
CACTTTCATCGTAAGGAAGTTGATTCGCTGTCCCTGGATGAAGCAAACAACTTGAAGAATG 
C C C T T T AC AAG C T AC AG AAC GAC C AC AG T C T AAC G G GAT AC G AAG C AAT C T C T G G T T AC CA 
TGGATACCCCAATCTGTGTCCGGAAGAAGGCGATGACAAAATACCCCTGCTGCGTCCCCGG 
ATGGGCATCTTTCCTTACTGGCACAGACTCTTGACCATTCAACTGGAAAGAGCTCTTGAGC 
ACAATGGTGCACTGCTTGGTGTTCCTTACTGGGACTGGAACAAGGACCTGTCGTCACTGCC 
GGCGTTCTTCTCCGACTCCAGCAACAACAATCCCTACTTCAAGTACCACATCGCCGGTGTT 
G G T C AC GAC AC C G T C AG AG AG C CAAC TAG T C T TAT AT AT AAC C AG C C C C AAAT C CAT G G T T 
AT GAT TAT C T C TAT T AC C TAG CAT T GAC C AC G C T T G AAG AAAAC AAT T AC TGGGACTTT G A 
GGTTCAGTATGAGATCCTCCACAACGCCGTCCACTCCTGGCTTGGAGGATCCCAGAAGTAT 
TCCATGTCTACCCTGGAGTATTCGGCCTTTGACCCTGTCTTTATGATCCTTCACTCGGGTC 
TAG AC AG AC T T T G GAT CAT C T G G CAAG AAC T T C AG AAG AT C AG G AG AAAG C C C T AC AAC T T 
CGCTAAATGTGCTTATCATATGATGGAAGAGCCACTGGCGCCCTTCAGCTATCCATCTATC 
AACCAGGACGAGTTCACCCGTGCCAACTCCAAGCCTTCTACAGTTTTTGACAGCCATAAGT 
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T CGG C T AC CAT T AC G AT AAC C T GAAT G T T AGAGG T C AC AGC AT C C AAGAAC T CAAC AC AAT 
CAT C AAT G AC T T G AG AAAC AC AG AC AG AAT C T AC G C AG GAT TTGTTTTGT C AG G CAT C G G T 
AC G T C T G C TAG T G T C AAG AT CTATCTCC G AAC AGAT G AC AAT G AC G AAG AAG T T G G AAC T T 
TCACTGTCCTGGGAGGAGAGAGGGAAATGCCATGGGCCTACGAGCGAGTTTTCAAGTATGA 
CAT C AC AG AG G T T G C AGATAGAC T T AAAAT T AAG T TAT G G G G AC AC C C T T T AAC T T C C G GA 
ACTGGAGATCACATCCTTACGAATGGAATCGGTGGTAAACAAGAGCCTACCCAAATCCTTT 
CAT CAT C T AC AG AC C T G C CAAT CAT G AC T AC GAT GTTCTTGT TAT C C C AG TANG GAAGAAA 
CCTTCACATCCCTCCCAAAGTTGTCGTCAAGAAAGGCACCCGCATCGAGTTCCACCCAGTC 
GATGATTCAGTTACGAGACCAGTTGTTGATCTTGGAAGCTACACTGCACTCTTCAACTGTG 
TGGTACCACCGTTCACATACCACGGATTCGAACTGAACCACGTCTATTCTGTCAAGCCTGG 
T G AC T AC TAT G T T AC T G G AC C C AC GAG AG AC C T T T G C C AG AAT G C AG AT G T C AG GAT T CAT 
AT C C AT G T T GAG GAT GAG T AA 



CGCAACAGGT 
Intron UTR 

GAGATAAGAAAC C C T T C T AAC AG T AAT AC G AC AC CAC AT T ACAG C T T AAAC AT GAT T G C CA 
TCGATGTTTTCATGTGTAGTATACGCTTTTCAGTTCTACATAATTTTGTTTTTCAAATCAA 
GTTTAGCAAATGAATCTATCACTGGAAAATAGGGTAGGGTAGCCAAGTGGTTAAAGCGGTC 
ACTGATCACGCCAAAGACGAGTGTCCTAACCTGCATGGGTACAAAAGTGAAGACCATTGCT 
GGTGTCTACCGCCGTAATATTGTTT.TTAGTATTGCTAAAACTTATACTCACCCATGCGCTG 
TAAAAG T GGAAT AAT AAT CAT AT T T CAAC AAAAGCACAAAAC CATT T CAT T T T CAT GAAAG 
CCTCTTGTT CAC C T G AAAG AC G C AAG AG AAC AAT AG T T C C T AAC AT T AT T T T C AGAC AT T G 
GAAATGTCCTGCACGTGTAAACCATATATCCTTTGAAATTTTTACGACTGCATCGTATACA 
AT T T AT G AT AT AAAT T T AAAAC T T T AT 



3 'UTR 



TTCTTGGTCTCCACATATTCACATATCAGCACCAAATGGTTTCGAAGGACATTGGCGTTCT 
TrTrT^f^raaTf^P ATTTCA ATAf A A(**ATTi^A A AATnArTTfAt^r! ATATr.AGTGTGCTTCGA 
AC GTGTTCCG G AAG TAC T C AAAT G T GC T AT G AC T GAAT TAT T G T AC AT ACAT AAC T TAT T G 
AT G T T CAAT AAAT AAAT G T T G AAAC GAAAAAAAAAAAAAAAAAAAAAAA 





Figur 7 

Abgeleitete Primarstruktur des HtH2 



Domane b 



HRLFVTQVEDALIRRGSPIGVPYWDWTQPMAHLPGLADNATYRDPISGDSRHNPFHDVEVA 
FENGRTERHPDSRLFEQPLFGKHTRLFDSIVYAFEQEDFCDFEVQFEMTHNNIHAWIGGGE 
KYSMSSLHYTAFDPIFYLRHSNTDRLWAIWQALQIRRNRPYKAHCAWSEERQPLKPFAFSS 
PLNNNEKTYENSVPTNVYDYEGVLGYTYDDLNFGGMDLGQLEEYIQRQRQRDRTFAGFFLS 
HIGTSANVEIIIDHGTLHTSVGTFAVLGGEKEMKWGFDRLYKYEITDELRQLNLRADDVFS 
ISVKVTDVDGSELSSELIPSAAIIFERSH 



Domane c 



•IDHQDPHHDTIIRKNVDNLTPEEINSLRRAMADLQSDKTAGGFQQIAAFHGEPKWCPSPDA 
EKKFSCCVHGMAVFPHWHRLLTVQGENALRKHGCLGALPYWDWTRPLSHLPDLVLVSSRTT 
PMPYSTVEARNPWYSGHIDTVGVDTTRSVRQELYEAPGFGHYTGVAKQVLLALEQDDFCDF 
EVQFEIAHNFIHALVGGSEPYGMASLRYTTYDPIFYLHHSNTDRLWAIWQALQKYRGKPYN 
SANCAIASMRKPLQPFGLTDEINPDDETRQHAVPFSVFDYKNNFNYEYDTLDFNGLSISQL 
DRELSRRKSHDRVFAGFLLHGIQQSALVKFFVCKSDDDCDHYAGEFYILGDEAEMPWGYDR 
LYKYEITEQLNALDLHIGDRFFIRYEAFDLHGTSLGSNIFPKPSVIHDEGA 



Domane d 



GHHQADEYDEWTAASHIRKNLKDLSKGEVESLRSAFLQLQNDGVYENIAKFHGKPGLCDD 
NGRKVACCVHGMPTFPQWHRLYVLQVENALLERGSAVSVPYWDWTETFTELPSLIAEATYF 
NSRQQTFDPNPFFRGKISFENAVTTRDPQPELYVNRYYYQNVMLVFEQDNYCDFEIQFEMV 
HNVLHAWLGGRATYSISSLDYSAFDPVFFLHHANTDRLWAIWQELQRYRKKPYNEADCAIN 
LMRKPLHPFDNSDLNHDPVTFKYSKPTDGFDYQNNFGYKYDNLEFNHFSIPRLEEIIRIRQ 
i?nTOVF^rTTmTrT^TWT^frwTTqr^fflTrFHyar,TFavT,nr,RTF.MaFHT? n RT.YR? 
DISETLRDLGIQLDSHDFDLSIKIQGVNGS YLDPHILPEPSLIFVPGSS 



Domane e 

SFLRPDGHSDDILVRKEVNSLTTRETASLIHALKSMQEDHSPDGFQAIASFHALPPLCPSP 
SAAHRYACCVHGMATFPQWHRLYTVQFQDALRRHGATVGVPYWDWLRPQSHLPELVTMETY 
HDIWSNRDFPNPFYQANIEFEGENITTEREVIADKLFVKGGHVFDKLVLQTSHPSAEQENY 
CDFE I QFE I LHNGVHTWVGGS RT YS I GHLH YAF YDPLFYLHHFQTDRI WAI WQELQEQRGL 
SGDEAHCALEQMREPLKPFSFGAPYNWNQLTQDFSRPEDTFDYRKFGYEYDNLEFLGMSVA 
ELDQYIIEHQENDRVFAGFLLSGFGGSASVNFQVCRADSTCQDAGYFTVLGGSAEMAWAFD 
RLYKYDITETLEKMHLRYDDDFTISVSLTANNGTVLSSSLIPTPSVIFQRGH 



Domane f 



RDINTRSMSPNRVRRELSDLSARDLSSLKSALRDLQEDDGPNGYQALAAFHGLPAGCHDSR 
GNEIACCIHGMPTFPQWHRLYTLQLEMALRRHGSSVAIPYWDWTKPISELPSLFTSPEYYD 
PWHDAVVNNPFSKGFVKFANTYTVRDPQEMLFQLCEHGES ILYEQTLLALEQTDYCDFEVQ 
FEVLHNVIHYLVGGRQTYALSSLHYASYDPFFFIHHSFVDKMWWWQALQKRRKLPYKRAD 
CAVNLMTKPMRPFDSDMNQNPFTKKHAVPNTLYDYETLYYS YDNLEIGGRNLDQLQAEIDR 
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SRSHDRVFAGFLLRGIGTSADVRFWICRNENDCHRGGIIFILGGAKEMPWSFDRNFKFDIT 
HVLENAG I S PE DVFDAE E P F Y I KVE.I HAVNKTMI P S S VI PAP T 1 1 Y S PGE 



Domane g 



GRAADSAHSANIAGSGVRKDVTTLTVSETENLRQALQGVIDDTGPNGYQAIASFHGSPPMC 
EMNGRPCVACCAHGMASFPHWHRLYVKQMEDALADHGSHIGIPYWDWTTAFTELPALVTDSE 
NNPFHEGRIDHLGVTTSRSPRDMLFNDPEQGSESFFYRQVLLALEQTDYCQFEVQFELTHN 
AIHSWTGGRSPYGMSTLEFTAYDPLFWLHHSNTDRIWAVWQALQKYRGLPYNEAHCEIQVL 
KQPLRPFNDDINHNPITKTNARPIDSFDYERFNYQYDTLSFHGKSIPELNDLLEERKREER 
TFAAFLLRGIGCSADWFDICRPNGDCVFAGTFAVLGGELEMPWSFDRLFRYDITRVMNQL 
HLQYDSDFS FRVKLVATNGTELS S DLLKS PTIEHEL 



Domane h 



GAHRGPVEETEVTRQHTDGNAHFHRKEVDSLSLDEANNLKNALYKLQNDHSLTGYEAISGY 
HGYPNLCPEEGDDKIPLLRPRMGIFPYWHRLLTIQLERALEHNGALLGVPYWDWNKDLSSL 
PAFFSDSSNNNPYFKYHIAGVGHDTVREPTSLI YNQPQIHGYDYLYYLALTTLEENNYWDF 
EVQYEILHNAVHSWLGGSQKYSMSTLEYSAFDPVFMILHSGLDRLWIIWQELQKIRRKPYN 
FAKCAYHMMEEPLAPFSYPSINQDEFTRANSKPSTVFDSHKFGYHYDNLNVRGHSIQELNT 
IINDLRNTDRI YAGFVLSGIGTSASVKI YLRTDDNDEEVGTFTVLGGEREMPWAYERVFKY 
DITEVADRLKIKLWGHPLTSGTGDHILTNGIGGKQEPTQILSSSTDLPIMTTMFLLSQXGR 
NLHIPPKVWKKGTRIEFHPVDDSVTRPWDLGSYTALFNCWPPFTYHGFELNHVYSVKP 
GDYYVTGPTRDLCQNADVRIHIHVEDE 




Figur 8 

cDNA-Sequenz in Verbindung mit Intronstruktur des KLH1 



Domane b 

GGCCTACCGTACTGGGACTGGACTGAACCCATGACACACATTCCGGGTCTGGCAGGAAACA 
AAACTTATGTGGATTCTCATGGTGCATCCCACACAAATCCTTTTCATAGTTCAGTGATTGC 
AT T T G AAG AAAAT G C T C C C C AC AC C AAAAG AC AAAT AG AT C AAAG AC T C T T T AAAC C C G C T 
AC C T T T G G AC AC C AC AC AGAC C T G T T C AAC C AGAT T T T GT AT G C C T T T GAAC AAGAAG AT T 
AC T G T GAC T T T GAAG T C C AAT T T GAGAT T AC C C AT AAC AC GAT T C AC G C T T G GAC AG G AGG 
AAGCGAACATTTCTCAATGTCGTCCCTACATTACACAGCTTTCGATCCTTTGTTTTACTTT 
CACCATTCTAACGTTGATCGTCTTTGGGCCGTTTGGCAAGCCTTACAGATGAGACGGCATA. 
AACCCTACAGGGCCCACTGCGCCATATCTCTGGAACATATGCATCTGAAACCATTCGCCTT 
T T CAT C T C C C C T T AACAAT AAC GAAAAGAC T CAT G C CAAT G C C AT GC C AAAC AAGAT C T AC 
GAC TAT GAAAAT G T C C T C CAT T AC AC AT AC GAAG AT T T AAC AT T T G GAG G CAT CTCTCTGG 
AAAAC AT AG AAAAGAT GAT C C AC GAAAAC CAG C AAG AAGAC AG AAT AT AT GCCGGTTTTCT 
CCTGGCTGGCATACGTACTTCAGCAAATGTTGATATCTTCATTAAAACTACCGATTCCGTG 
CAACATAAGGCTGGAACATTTGCAGTGCTCGGTGGAAGCAAGGAAATGAAGTGGGGATTTG 
ATCGCGTTTTCAAGTTTGACATCACGCACGTTTTGAAAGATCTCGATCTCACTGCTGATGG 
CGATTTCGAAGTTACTGTTGACATCACTGAAGTCGATGGAACTAAACTTGCATCCAGTCTT 
ATTCCACATGCTTCTGTCATTCGTGAGCATGCACGTGGTAAGCTGAATAGAG 



Intron b/c 



G T T T T G T AAT AAT T AT G TAG AAT TCTTTACCT CAG AAT AAG AT G AG G T C AC AT GGGTTTTG 
CAAAAC TAT T AC G T T C G AAT TAAT AT T AAT AAT AC C G GAC C C T C C AC T G G T ACAT AT T TAT 
C T T TAT AAC GAT AAT AG C GAT GAT GAT GAT GAT GAT GAT GAT GAT GAT GAT GAT gAT AAT g 
AT gATGCCGG TAT T G C AC G TAAT C CAG C C G Ac T TAG AT GAC AC C C T AAG G G T G CAG AAAG T 
ATAaCAATTAGATTGCGTTtGCATCTGTGTATGCGTGTGCTTTAaCCAAAAGTCAAAATAA 
AAG T G C AAAC C C T T AG T T TAT T CAT T T GAT AG AGC C T T T T AC GAT AAG AAC AAT G T AAT AA 
AT T AGAAC AT AAC T G AAAC C T C C G AAAG AAG GCCTGTTTGT C AAG AGAG G TAT C GAC AT G A 

TAAT C AC AT C G C AC T AT GG C T G C AAG AC G T G T AC GAG T AC AC TAT AT AC T T AC C TAAT GAC 
CAAC C AC AAG GCTGGCTTTGT TAAT AT T G T TAT T T C AC AG AAAT AAAC AC AGAAT T C CAG C 
ATTTGGCTGGTGTATTTAGCAAAACACCGATATGACACTCA.TGTTTTATTACATTTTTTTC 
i AG 

Domane c 



TTAAATTTGACAAAGTGCCAAGGAGTCGTCTTATTCGAAAAAATGTAGACCGTTTGAGCCC 
C GAG GAGAT G AAT GAAC T T C G T AAAG CCCTAGCCTTACT G AAAG AG GAC AAAAG T G C C G G T 
GGATTTCAGCAGCTTGGTGCATTCCATGGGGAGCCAAAATGGTGTCCTAGTCCCGAAGCAT 
CTAAAAAATTTGCCTGCTGTGTTCACGGCATGTCTGTGTTCCCTCACTGGCATCGACTGTT 
GACGGTTCAGAGTGAAAATGCTTTGAGACGACATGGCTACGATGGAGCTTTGCCGTACTGG 
GATTGGACCTCTCCTCTTAATCACCTTCCCGAACTGGCAGATCATGAGAAGTACGTCGACC 
C T GAAG AT G G G G T AG AGAAG CAT AAC CCTTGGTTC GAT G G T CAT AT AGAT AC AG T C G AC AA 
AACAAC AAC AAG AAG T G T T CAG AAT AAAC T C T T C GAAC AG C C T GAG TTTGGTCAT TAT AC A 
AGCATTGCCAAACAAGTACTGCTAGCGTTGGAACAGGACAATTTCTGTGACTTTGAAATCC 
AATATGAGATTGCCCATAACTACATCCATGCACTTGTAGGAGGCGCTCAGCCTTATGGTAT 
GGCATCGCTTCGCTACACTGCTTTTGATCCACTATTCTACTTGCATCACTCTAATACAGAT 
C G TAT AT G G G CAAT AT G G CAG G C T T T AC AG AAG T AC AG AG GAAAAC C G T AC AAC G T T G C T A 
ACTGTGCTGTTACATCGATGAGAGAACCTTTGCAACCATTTGGCCTCTCTGCCAATATCAA 
C AC AG AC CAT G T AAC C AAG GAG CAT T C AG T G C CAT T CAAC G T T T T T GAT T AC AAGAC CAAT 



# 
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TTCAATTATGAATATGACACTTTGGAATTTAACGGTCTCTCAATCTCTCAGTTGAATAAAA 
AGCTCGAAGCGATAAAGAGCCAAGACAGGTTCTTTGCAGGCTTCCTGTTATCTGGTTTCAA 
GAAATCATCTCTTGTTAAATTCAATATTTGCACCGATAGCAGCAACTGTCACCCCGCTGGA 
GAG TTTTACCTTCTGGGT GAT G AAAAC GAG AT G C CAT G G G CAT AC GAT AG AG T C T T C AAAT 
AT G AC AT AAC C G AAAAAC T C C AC GAT C T AAAG C T G CAT G C AG AAG AC C AC T T C T AC AT T G A 
CTATGAAGTATTTGACCTTAAACCAGCAAGCCTGGGAAAAGATTTGTTCAAGCAGCCTTCA 
G T CAT T CAT GAAC C AAG AAT AG 

Intron c/d 

GT AC T T G T TAT AT G T T T C G AAT AT T G C C GAT AC C T T C AAT AT AT AT AC T T TAT C AAAG T AA 
T T GAT TAAT C T G AAG T AAT TTTCCTTTC C AG T AGAGAT T C AG T T G AT AC AAC AAGAAT T C G 
CCCTGTTGTATGTCACTTTATTTTCATCAAACGATTCGAAGTGAGCTGTCCATGCCACAAT 
GGGGTCTCTGTAACTTTCTCGTATGGGGTATAGATTATATAGACGTGGCAGACCTTACGTA 
TAACTAATATTTGTGTAATGTCGTTTCAG 



Domane d 

• GTCACCATGAAGGCGAAGTATATCAAGCTGAAGTAACTTCTGCCAACCGTATTCGAAAAAA 
CATTGAAAATCTGAGCCTTGGTGAACTCGAAAGTCTGAGAGCTGCCTTCCTGGAAATTGAA 
AACGATGGAACTTACGAATCAATAGCTAAATTCCATGGTAGCCCTGGTTTGTGCCAGTTAA 
ATGGTAACCCCATCTCTTGTTGTGTCCATGGCATGCCAACTTTCCCTCACTGGCACAGACT 
GTACGTGGTTGTCGTTGAGAATGCCCTCCTGAAAAAAGGATCATCTGTAGCTGTTCCCTAT 
T G G G AC T G G AC AAAAC G AAT C GAAC AT TTACCTCACCT GAT T T C AG AC G C C AC T T AC T AC A 
AT T C C AG GCAAC AT C AC TAT GAGACAAAC C C AT T C CAT CAT G G CAAAAT CACACAC G AG AA 
T G AAAT C AC T AC TAG G GAT C C C AAG GAC AG C C T C T T C CAT T C AG AC T AC T T T T AC GAG C AG 
GTCCTTTACGCCTTGGAGCAGGATAACTTCTGTGATTTCGAGATTCAGTTGGAGATATTAC 
ACAATGCATTGCATTCTTTACTTGGTGGCAAAGGTAAATATTCCATGTCAAACCTTGATTA 
CGCTGCTTTTGATCCTGTGTTCTTCCTTCATCACGCAACGACTGACAGAATCTGGGCAATC 
TGGCAAGACCTTCAGAGGTTCCGAAAACGGCCATACCGAGAAGCGAATTGCGCTATCCAAT 
T GAT G CACAC G C C AC T C C AG C C G T T T GAT AAG AG C GAC AAC AAT GAC GAGG C AAC GAAAAC ' 
GC AT G C C AC T C C AC AT GAT G G T T T T G AAT AT C AAAAC AG C T T T G G T TAT G C T T AC GAT AAT 
CTGGAACTGAATCACTACTCGATTCCTCAGCTTGATCACATGCTGCAAGAAAGAAAAAGGC 

A.TGACAGAGTATTCGC!TGGCTTmTr.rTTCACAATATTGGAAr.a trTnr.CGATnncrATGT 

ATTTGTATGTCTCCCAACTGGGGAACACACGAAGGACTGCAGTCATGAGGC.TGGTATGTTC 
TCCATCTTAGGCGGTCAAACGGAgATGTCCTTTGTATTTGACAGACTTTACAAACTTGACA 
TAACTAAAGCCTTGAAAAAGAACGGTGTGCACCTGCAAGGGGATTTCGATCTGGAAATTGA 
-^^A GATTACGGCTGTGAATGGATCTCATCTAGACAGTCATGTCATCCACTCTCCCACTATACTG 
TTTGAGGCCGGAACAG 



Intron d/e 

G T AAC TAT T T T G T C AC T G T AAC C AAC AAC T G C AG T C TAT T T T G CAAT T AC GAT AAT AAC AA 
TTTTTGAAATATATCTTTATTAAAGCAAAGGTTTCTAGAGACAAACAGCCGGCTCTAATTA 
TTTTTTCGAACTTACGCTTGAGTAAAGATCTGCAAATGGCAACCCTACCTATACTATTAAA 
AAT AT AAT G T T AC AT T C G TAT C T GAAT G T T TAAT AAAT C AC T T CAT AT T C T G T T G C AG 

Domane e 

AT T C T G C C C AC AC AGAT GAT G GAC AC AC T GAAC C AG T GAT GAT T C G C AAAGAT AT CACAC A 
ATTGGACAAGCGTCAACAACTGTCACTGGTGAAAGCCCTCGAGTCCATGAAAGCCGACCAT 
TCATCTGATGGGTTCCAGGCAATCGCTTCCTTCCATGCTCTTCCTCCTCTTTGTCCATCAC 
CAGCTGCTTCAAAGAGGTTTGCGTGCTGCGTCCATGGCATGCCAACCTTCCCGCAATG 
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Figur 9 



Abgeleitete Primarstruktur des KLH1 



Domane b 

GLPYWDWTEPMTHIPGLAGNKTYVDSHGASHTNPFHSSVIAFEENAPHTKRQIDQRLFKPA 
TFGHHTDLFNQILYAFEQEDYCDFEVQFEITHNTIHAWTGGSEHFSMSSLHYTAFDPLFYF 
HHSNVDRLWAVWQALQMRRHKPYRAHCAISLEHMHLKPFAFSSPLNNNEKTHANAMPNKIY 
DYENVLHYTYEDLTFGGISLENIEKMIHENQQEDRI YAGFLLAGIRTSANVDIFIKTTDSV 
QHKAGTFAVLGGSKEMKWGFDRVFKFDITHVLKDLDLTADGDFEVTVDITEVDGTKLASSL 
I PHASVI REHARGKLNR 



Domane c 

^^^R VKFDKVPRSRLIRKNVDRLSPEEMNELRKALALLKEDKSAGGFQQLGAFHGEPKWCPSPEA 
SKKFACCVHGMSVFPHWHRLLTVQSENALRRHGYDGALPYWDWTSPLNHLPELADHEKYVD 
PEDGVEKHNPWFDGHIDTVDKTTTRSVQNKLFEQPEFGHYTSIAKQVLLALEQDNFCDFEI 
QYEIAHNYIHALVGGAQPYGMASLRYTAFDPLFYLHHSNTDRIWAIWQALQKYRGKPYNVA 
NCAVTSMREPLQPFGLSANINTDHVTKEHSVPFNVFDYKTNFNYEYDTLEFNGLS I SQLNK 
KLEAIKSQDRFFAGFLLSGFKKSSLVKFNICTDSSNCHPAGEFYLLGDENEMPWAYDRVFK 
YDITEKLHDLKLHAEDHFYIDYEVFDLKPASLGKDLFKQPSVI HEPRI 



Domane d 

GHHEGEVYQAEVT S ANRI RKNI ENLS LGELE S LRAAFLE I ENDGTYE S I AKFHGS PGLCQL 
NGNPISCCVHGMPTFPHWHRLYWWENALLKKGSSVAVPYWDWTKRIEHLPHLISDATYY 
NSRQHHYETNPFHHGKITHENEITTRDPKDSLFHSDYFYEQVLYALEQDNFCDFEIQLEIL 
HNALHSLLGGKGKYSMSNLDYAAFDPVFFLHHATTDRIWAIWQDLQRFRKRPYREANCAIQ 

LMIITPLQPFDK3DNNDEATKTIIATPIIDGFEYQI^SFGYAYDNLELl\rHYSIPQLDHMLQERKR 

HDRVFAGFLLHNIGTSADGHVFVCLPTGEHTKDCSHEAGMFSILGGQTEMS FVFDRLYKLD 
, _ I TKALKKNGVHLQGDFDLE IE I TAVNGSHLDSHVI HS PT I LFEAG 

Domane e 

DSAHTDDGHTEPVMIRKDITQLDKRQQLSLVKALESMKADHSSDGFQAIASFHALPPLCPS 
PAASKRFACCVHGMPTFPQWHRLYTVQFQDSLRKHGAWGLPYWDWTLPR 
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Figur 10 



cDNA-Sequenz in Verbindung mit Intronstruktur des KLH2 



Domane b 

GGCCTGCCCTACTGGGATTGGACCATGCCAATGAGTCATTTGCCAGAACTGGCTACAAGTG 
AGACCTACCTCGATCCAGTTACTGGGGAAACTAAAAACAACCCTTTCCATCACGCCCAAGT 
GGCGTTTGAAAATGGTGTAACAAGCAGGAATCCTGATGCCAAACTTTTTATGAAACCAACT 
T AC G GAG AC C AC AC TTACCTCTTCGACAG CAT G A T C T AC GCATTTGAG C AG GAAG AC T T C T 
G C G AC T T T GAAG T C C AAT AT GAG C T C AC G C AT AAT G C AAT AC AT GCATGGGTTG GAG G C AG 
TGAAAAGTATTCAATGTCTTCTCTTCACtacacTGCTTTTGATCCTATATTTTACCTCCAT 
CACTCAAATGTTGATCGTCTCTGGGCCATTTGGCAAGCTCTTCAAATCAGGAGAGGCAAGT 
CTTACAAGGCCCACTGCGCCTCGTCTCAAGAAAGAGAACCATTAAAGCCTTTTGCATTCAG 
T T C C C C AC T G AAC AAC AAC GAG AAAAC G T AC C AC AAC TCTGTCCC C AC T AAC G T T TAT G AC 
TATGTGGGAGTTTTGCACTATCGATATGATGACCTTCAGTTTGGCGGTATGACCATGTCAG 
AAC T T GAG G AAT AT AT T C AC AAG C AG AC AC AAC AT GAT AG AAC C T T T G C AG GAT T C T T C C T 
T T CAT AT AT T G GAAC AT C AG CAAGC G TAGAT AT C T T CAT C AAT C G AGAAG G T CAT GAT AAA 
TACAAAGTGGGAAGTTTTGTAGTACTTGGTGGATCCAAAGAAATGAAATGGGGCTTTGATA 
GAAT G T AC AAG TAT G AGAT C AC T GAG G C T C T GAAG AC G C T GAAT G T T GC AG T GGAT GAT G G 
GTTCAGCATTACTGTTGAGATCACCGATGTTGATGGATCTCCCCCATCTGCAGATCTCATT 
CCACCTCCTGCTATAATCtTTGaACGTGGTCaTG 



Intron 2b/c 



AGGTATTTAAAAAAGTAATAAAACCaTATTTTCGAATGCGCTTTATGAAATATCGTGTGAC 
TGGTTCTTTAGTT T AC AT G GAG T G T AAC AAC AT GCTCCATCAGTT G AC AT AT AC T G C T C AC 
AC AAAG T AAG G GAT AT T T GAT AAT G AT AACAAAT AT AAT C AAAG CG G T TAT AC TAT CAAG A 
CTTATTCACATAATTACAGGTGAAGGGAGGTGTGATCGTGTTCACTGATCAGGTTGAGGCC 
AGAGAAGTCCCAGTTTGAGTCTTGCAGAAGATGATGTTTAGGCATGGGGTCGAATCACCAA 
AAT CAC AT G AC T T CAATAAC G G G T T G GAC CAC C T C GAG C GAC gAT G CAAG CAG T AGAG C G T 
CTACGCATGCTCCTGATAAGGCGACCAATCTGTTCCTGGGGAATCAGtCGCCACTCCTCTT 
GTAGTGCCACGCTCATTTCTGCTACGGTCCTGGGTACCTGCTATCGGgTCTTGATCCGTAT 
CCCAAGGATGTCCCACACATGTTCAAgGTGAGAGGTCGGGGAACATCGCTGGCCACGGTaA 
GGtCTGAATTTGATGCCGTTGAAAGTGAGCTCTGACAACcTGAGCATGGtGAGCTCTGACG 
I TTGTCGTCCTGAAAGATGAATcCAGCTcCaTGaCAGCGAGCAAaGGGCAGGACGTGTTGGT 
CAATGCAGTTGTCTCTGCAGTACACACCTGTCACTCGCCACTCACAAGCGTGTAGATCTGT 
AC GAC CAG T C AT GG AGAT C C CAG C C CAC AT CAT AAC G GAC C C C TAT C CAT AC C GAT CAT GA 
GCCACCATAGCAGCGTCTTGATGACGTTCTCCCTGTCGCCTCGACATCCTcACACGGCCAA 
AAGGAACGTGGACTCGTCACTGAACATGACATTAGCCAACCTGGCACTTGTCCACCGCTGA 
TGTTGGCGAGACCATTCCAGTCGAGCTCTTCGGTGTCTGGCTTTCATCGATAACACGACGT 
AAGGTCTGCGGGCGTGCAAGACGGCTCTATGCAGGCGATTTCGGATTGTCTGGGTGCTAAC 
TCTGATCCCAGGTGCCTGCTGAAGTTGATGCTGGATCTGTGTGGCATTGAGATGGCGATTC 
CTTAGGACTGTGGAGATGATGAATCGATCTTGACTTATGGTGGTGACATTAGGACGTCGGG 
TTCGTGTCCTATCCTGCACTCTTCCAGTTGTTCGGTGACGCTCTGGTACCCGGCTGATTAC 
TGACTGAGAATATCCATCTGCCGTGCGACATGAGCCTGTGTTGGCCCAGCCTGAAGCATTG 
CAATCGCCAGAGACGCTCTTCAAAAGTCATTCGACGCATGGtTTTCTGTTCACAAATGACA 
GCGTAAAACAGtTTTTGGtGCTTTTATGCTTCCCAAGAGCATGAAAAACACGTTCTATgGG 
TCGtGCACACCTTACATGACAAGtGtGAAAAGtGACTTGcACCCCCTTGtGtGTTCGGATG 
CACACTCTGTTTACGTACTGATGCGATTTGGCGTCTAAACATGTTTTGGCGTCTAAACATG 
TTTTCCTGCATGATTCATATACTATTTTGTCATATTCCTGGCATCAAACCAAACTACAGTG 
AAAT AT AT T T C AAT AT C C C C T AC TTTGTGTGAG TAG TAT AG AT C AC T G CAG AC AAC AT AT A 
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G ACAAt GCAgtTaCaCCGT C AAC AAT C C C AG T CAT T AAT TATGATGaCaCTTC C AC AC AT A 
GTGTCAGTGATTGTAATTCAaCTGTACACACTTTTCCCGTGAACATTCAGGATCTATATGA 
C T AAATAT AT AAC AT TAG TAT AC G T G C AG T T T T G TAT C G C T AC GAC AT T G T T G T AAC T C T T 
TGTTTAATCATTTaACAG 



Domane c 



CTGATGCCAAAGaCTTTGgCCATAGCAGAAAAATCAGgAAAGcCGTTGATTcTcTGACAGT 
C g AAGAAC AAAc T T C G T T GAG g C GAG c TAT G g C AG AT c T AC AG GAC G AC AAAAC AT C AG G G 
GGTTTCCAGCAGATTGCAGCATTCCACGGAGAACCAAAATGGTGTCCAAGCCCCgAAGCGG 
AGAAAAAATTTGCATGCTGTGTTCATGGAATGGCTGTTTTCCCTCACTGGCACAGATTGCT 
GACAGTTCAAGGAGAAAATGCTCTGAGGAAACATGGCTTTACTGGTGGACTGCCCTACTGG 
GACTGGACTCGATCAATGAGCGCCCTTCCACATTTTGTTGCTGATCCTACTTACAATGATG 
C TAT T T C C AG C C AG GAAG AAG AT AAC C C AT G G CAT C AT G G T C AC AT AGAC TCTGTTGGGCA 
TGATACTACAAGAGATGTGCGTGATGATCTTTATCAATCTCCTGGTTTCGGTCACTACACA 
GATATTGCACAACAAGTCCTTCTGGCCTTTGAGCAGGACAGTTTCTGTGATTTTGAGGTAC 
AAT T T GAAAT T G C C CAT AAT T T CAT AC AT G CAC T GAT T G G T G G T AAC GAAC CAT AC AG TAT 
G T CAT C T T T GAG G TAT AC T AC AT AC GAT C CAAT CTTCTTCTTG C AC C AC T C C AGT ACAGAC 
CGACTTTG'GGCCATCTGGCAAGCAATCACTAGTGCGGCCGCCTGCAGGTCGACCATAAGGG 
AGAGCTCCCAACGCgtTGGAtGCAATCT 



Domane g 



ATGGCTGTGTTTCCGCACTGGCACAGACTGTTTGTGAAACAGATGGAGGACGCACTTGCTG 
CTCATGGAGCTCATATTGGCATACCATACTGGGATTGGACAAGTGCGTTTAGTCATCTGCC 
CGCCC TAG T GAC T GAC CAC GAG AAC AAT C C C T T C CAC CAC 



Intron g (2) 



G TAT G T G T C AAAT CGTTTTAG GAAC T G C C T TAT C CAT T T T AC AAT T AC GAG T AC AAAAT G A 
AAAC G GAAAC T G T G T GAC C T C GAAAAG T G CAAT C T T TAAAG GAT G CAAT G T AC AC AAT AAA 
ATGCTCCGATCAAAAGCGATGGCTAGAAATCATTTTCCCTCTAATTCCCTTTCACACAGCT 
CGGTTCGTTT T AAG TAG GAAC AAG T C T C T G CAAAAAC AT C AC AAAT AAAG AG AAC AC AG AA 
AAAACCTCATTCTCGTTTCTGTATTCCGAAAATGAAATTTACAATTTCTTTCATTTATAG 



I Domane g 

GGCCATATTGGTCATCTGAATGTGGATACATCTCGATCTCCAAGAGACATGCTGTTTAATG 
AT C C T GAAC AAG G C T CAGAAT CAT T C T T C T ACAGAC AG GTTCTCTT GAC T C T AGAACAGAC 
AGACTTCTGCCAATTTGAAGTTCAGTTTGAACTTACACACAATGCCATCCACTCTTGGACT 
G GAG G ACAT AC T C CAT AT G GAAT G T CAT CAC T GGAAT AT ACAGC AT AT GAT C CAC T C T T T T 
ATCTCCACCATTCCAACACTGATCGTATCTGGGCCATCTGGCAGGCACTCCAGAAATATAG 
AGGTCTTCCATACAACGCAGCTCACTGCGATATccaagttctgaaacaacctcTTAAACCA 
TTCAGCGAGTCCAGGAATCCAAACCCAGTCACCAGAGCCAATTCTAGGGCCGTTGATTCAT 
T TGAT TATGAGAAAT T CAAT TAT C AATAT GACAC AC T TAC C T T C CAC G GAC T T T C TATC C C 
AGAAC T T GAT G C CAT G C T T C AAG AG AG AAAG AAG GAAG AG AG AAC AT TTGCAGCCTTCCTG 
TTGCACGGATTTGGCGCCAGTGCTGATGTTTCGTTTGATGTCTGCACACCTGATGGTCATT 
GTGCCTTTGCTGGAACCTTCGCGGTACTTGGTGGGGAGCTTGAGATGCCCTGGTCCTTTGA 
AAG AT TGTTCCGT TAC GAT AT CAC AAAG G T T C T C AAGC AG AT GAAT C T T CAC TAT GAT T C T 
GAGTTCCACTTTGAGTTGAAGATTGTTGGCACAGATGGAACAGAACTGCCATCGGATCGTA 
T CAAGAGCC C TAC CAT T G AACAC CAT G GAGGAG 
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Intron g/h 

GTATGTTTTGAGATCCACATAATCTTCTACCCTGTCTCATTTCTAA.TGCTCTTCAATACAC 
AATTTATATAGCCTTTGAGCTTCAGATGTATTACGGACAGGCATTACAGTATACATGTAAT 
ATGGTTTTCTGCTATTTGCAAAAATTGTGTCCTATCTCTGTTCAGATCATCATGGCGGTGA 
CACCTAG 



Domane h 

GTCACGATCACAGTGAACGTCACGATGGATTTTTCAGGAAGGAAGTCGGTTCCCTGTCCCT 
G GAT G AAG C C AAT GAC C T T AAAAAT G C AC T G T AC AAG C T GC AG AAT GAT C AG G G T C C C AAT 
GGATATGAATCAATAGCCGGTTACCATGGCTATCCATTCCTCTGCCCTGAACATGGTGAAG 
ACCAGTACGCATGCTGTGTCCACGGAATGCCTGTATTTCCACATTGGCACAGACTTCATAC 
AATCCAGTTTGAGAGAGCTCTCAAAGAACATGGTTCTCATTTGGGTCTGCCATACTGGGAC 
TGGAC 
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Figur 11 



Abgeleitete Primarstruktur von KLH2 



Domane b 

GLPYWDWTMPMSHLPELATSETYLDPVTGETKNNPFHHAQVAFENGVTSRNPDAKLFMKPT 
YGDHTYLFDSMI YAFEQEDFCDFEVQYELTHNAIHAWVGGSEKYSMSSLHYTAFDPIFYLH 
HSNVDRLWAIWQALQIRRGKSYKAHCASSQEREPLKPFAFSSPLNNNEKTYHNSVPTNVYD 
YVGVLHYRYDDLQFGGMTMSELEEYIHKQTQHDRTFAGFFLSYIGTSASVDI FINREGHDK 
YKVGS FWLGGSKEMKWG FDRMYKYE I TEALKTLNVAVDDGFS I TVE I TDVDGS PPSADLI 
PPPAIIFERGHA 



Domane c 

DAKDFGHSRKIRKAVDSLTVEEQTSLRRAMADLQDDKTSGGFQQIAAFHGEPKWCPSPEAE 
KKFACCVHGMAVFPHWHRLLTVQGENALRKHGFTGGLPYWDWTRSMSALPHFVADPTYNDA 
ISSQEEDNPWHHGHIDSVGHDTTRDVRDDLYQSPGFGHYTDIAQQVLLAFEQDSFCDFEVQ 
FEIAHNFIHALIGGNEPYSMSSLRYTTYDPIFFLHHSSTDRLWAIWQALQKYRGKPYNTAN 
CAIASMRKPLQPFGLDSVINPDDETREHSVPFRVFDYKNNFDYEYESLAFNGLSIAQLDRE 
LQRRKSHDRVFAGFLLHE I GQSAKHNVS DCDH YAGEFYI LGDEAEMPWR YDRVYKYE I TQQ 
LHDLDLHVGDNFFLKYEAFDLNGGSLGGSIFSQPSVIFEPAAGMF 



Domane d 

GSHQADEYREAVTSASHIRKNIRDLSEGEIESIRSAFLQIQKEGI YENIAKFHGKPGLCEH 
DGHPVACCVHGMPTFPHWHRLYVLQVENALLERGSAVAVPYWDWTLPR 



Domano g : 

MAVFPHWHRLFVKQIffiDALAAHGAHIGIPYWDWTSAFSHLPALVTDHENNPFHHGHIGHLN 
VDTSRSPRDMLFNDPEQGSESFFYRQVLLTLEQTDFCQFEVQFELTHNAIHSWTGGHTPYG 
IMSSLEYTAYDPLFYLHHSNTDRIWAIWQALQKYRGLPYNAAHCDIQVLKQPLKPFSESRNP 
NPVTRANSRAVDSFDYEKFNYQYDTLTFHGLSI PELDAMLQERKKEERTFAAFLLHGFGAS 
ADVS FDVCTPDGHCAFAGTFAVLGGELEMPWS FERLFRYDI TKVLKQMNLH YDSE FHFELK 
IVGTDGTELPSDRIKSPTIEHHGG 



Domane h 

GHDHSERHDGFFRKEVGSLSLDEANDLKNALYKLQNDQGPNGYESIAGYHGYPFLCPEHGE 
DQYACCVHGMPVFPHWHRLHTIQFERALKEHGSHLGLPYWDW 



